概要
Azure Blob Storage に接続する方法について説明します。
検証環境
製品 | バージョン | 備考 |
---|---|---|
TDV Server |
8.5 |
CSVファイルへの接続:Windows Server 2019環境で実行 |
TDV Studo |
8.5 |
Windows 環境で実行 |
Azure Portal | - | 以降の説明およびスクリーンショットは2022年8月時点のもの |
Azure Data Lake Storage
本記事で紹介する一連の手順では Azure Data Lake Storage Gen2 (以下、ADLS)を利用し、ストレージアカウント内のコンテナーにあるファイル(presidents.csv
)に接続します。
事前準備
ADLSおよびAzure AD側で事前準備作業を実施します。
ストレージアカウントおよびBlobコンテナーは事前に作成済みであることを前提とします。
ファイアウォール設定
TDV Serverからの接続を許可するために、ストレージ アカウントのファイアウォール設定にTDV ServerのIPアドレスを追加しておきます。
コンテナー アクセスレベル変更
コンテナーのアクセスレベルをコンテナー
に変更します。
Azure AD アプリケーション
1. TDVからADLS への接続に利用するAzure AD アプリケーションを作成します。
アプリに付与されるクライアントIDはTDVのアダプタ設定でApplication(client) IDとして利用するため、メモなどに控えておきます。
2. クライアント シークレットを作成します。
作成直後に値に表示される文字列はTDVのアダプタ設定でClient Secretとして利用するため、メモなどに控えておきます。
3. エンドポイント一覧にOAuth 2.0 トークン エンドポイント(v1)として表示されているエンドポイントもTDVのアダプタ設定でRefresh Urlとして利用するため、メモなどに控えておきます。
ロールの割り当ての追加
ストレージ アカウントのアクセス制御にて、作成したAzure AD アプリ に以下のロールを付与します。
- ストレージ BLOB データ共同作成者
- ストレージ BLOB データ所有者
- ストレージ BLOB データ閲覧者
- ストレージ キュー データ共同作成者
TDVデータソース接続
TDVからAzure Blob Storageに接続します。
アダプタ設定
1. Azure Data Lake Storage アダプタを利用するデータソースを作成し、以下の項目をセットします。(以下で指定のない項目はデフォルト値で問題ありません。)
項目 | 内容 |
---|---|
URI |
ADLSに接続するためのURI |
Application(client) ID |
Azure AD アプリケーションを登録する際に作成されるID |
Client Secret | Azure AD アプリケーションのクライアント シークレット |
Refresh Url |
TDV Server が ADLS に接続するために必要なトークンを発行するためのURL |
2. データソースを保存し、接続テストを行い、正常に接続できることを確認します。
イントロスペクト
リソースの追加/削除… をクリックし、イントロスペクトを行います。
リソースが取得できることを確認します。
データ取得
イントロスペクトされたテーブルをプレビューできることを確認します。
Parquetファイルへの接続
Blob Storage上にあるParquet形式のファイルにも接続することができます。