概要
TDV の機能の一つである Discovery について説明します。
検証環境
製品 | バージョン | 備考 |
---|---|---|
TDV Server |
8.5.5 |
Windows Server 2019環境で実行 |
TDV Studio |
Discovery とは
Discoveryは、データの中に隠された相関関係を明らかにするための機能であり、データの仮想化やレポーティングに使用するデータモデルの構築を支援します。
TDV Studioで作業する場合、Discoveryを使用して、アプリケーション、データベース、データウェアハウスなど、あらゆるデータリポジトリからデータとメタデータをスキャンすることができます。
次に、Discoveryのグラフィカルなツールを使用して、システムのメタデータと検出された関係に基づいてデータモデルを作成することができます。
データモデルから、TDVでビューを作成することができます。
利用方法
以下の作業を行うための手順を説明します。
以降に示す手順におけるシナリオはあくまでも例であり、最小スコアのしきい値や、どのリレーションシップを採用するかといった判断は、対象となるデータソースやモデリングのポリシーに依存するものであることはご留意ください。
対象データソース
本記事では、例として、以下のような 関連のありそうな8件のテーブルが 3種類のデータソース(Oracle, PostgreSQL, SQL Server)に分散されている状態で、TDVにデータソースとしてイントロスペクトした状態を前提とします。
データソースのインデックス作成とリレーションシップ検出
インデックス作成およびリレーションシップの検出を行います。
ここでの インデックス とは、データをより速く取得するための内部マッピングを意味します。
Discoveryはデータソースにインデックスを付け、関係の検出用に最適化します。
① TDV Studio の 検出 タブ において、 タスク タブ に移動し、スケジューラ… をクリックします。
② 対象のデータソースを選択し、スキャン をクリックします。
③ 以下のようにスキャンが開始されるので、完了まで待機します。
④ すべてのタスクが正常に完了することを確認します。
モデルの作成
続いて、モデルを作成します。
① TDV Studio の モデラー タブにおいて、任意の場所に新しいモデルを作成します。
② リソースの追加/削除 をクリックします。
③ 対象のデータソースを選択し、OK をクリックします。
④ 以下のように選択したデータソース間のリレーションシップがグラフィカルに表示されます。
青色のオブジェクトはテーブルを意味します。
orders テーブル と LINEITEM テーブル 間のリレーションシップの詳細を確認するために、両テーブル間に引かれている線をクリックして選択した状態で右クリックから View Relationship Details をクリックします。
⑤ 画面下部に 図 タブが表示され、その中の リレーションシップスコアの詳細 タブに 2テーブル間のリレーションシップスコアに関する詳細情報が表示されます。
リレーションシップスコアは、片方のテーブルの特定のカラムともう片方のテーブルの特定のカラムにおける一致度合いとして、 RPS(Relationship Probability Score) というスコアをもとに計算されています。
下の図では、最小スコア:75
と表示されているように、リレーションシップスコアが 75
以上 のリレーションシップのみが表示されています。
参考)関係確率スコア(Relationship Probability Score, RPS)について
⑥ リレーションシップ一致の詳細 では、両カラム間で一致したレコードの一覧が表示されています。
⑦ リレーションシップ列の詳細 では、2テーブルのカラム一覧と詳細が表示されています。
⑧ 次に 最小スコア:80
に変更し、表示されるリレーションシップをよりリレーションシップスコアの高いもののみに限定します。
⑨ CUSTOMER テーブルと LINEITEM テーブル 間の リレーションシップを不採用とするために、対象のリレーションシップを選択した状態で右クリックから Mark Invalid をクリックします。
⑩ CUSTOMER テーブルと LINEITEM テーブル 間の リレーションシップが薄い点線に変わり、無効化されます。
ビューの作成
これまでに作成したモデルから、ビューを作成します。
① CUSTOMER テーブルと orders テーブル 間の リレーションシップを選択した状態で右クリックから Create View Using Relationship をクリックします。
② 作成するビューの保存場所と名前を指定し、OK をクリックします。
③ ビューが正常に作成されることを確認します。
④ ビューが正常に実行できることを確認します。
⑤ 作成されたビューはモデル画面上では緑色のオブジェクトで表示されます。