概要
TDV ServerからDatabricksに接続し、イントロスペクトおよびクエリを実行する方法について説明します。
本記事では、TDV Serverに標準で提供されているSparkSQLアダプタ利用します。
検証環境
製品・サービス | バージョン | 備考 |
---|---|---|
TDV Server | 8.8.0 | Red Hat Enterprise Linux Server(RHEL)9.x の仮想マシン上で実行 |
TDV Studio | 8.8.0 | Windows 10 のPC上で実行 |
Databricks on AWS | 15.4 LTS | ― |
前提条件
以降で説明する手順における前提条件を以下に示します。
接続先
Databricksクラスターに接続します。
SparkSQLアダプタはSQLウェアハウスへの接続には対応していませんので、ご注意ください。
クエリ実行先となるカタログは以下を使用します。
認証方式
Databricks個人用アクセストークン(PAT)を利用します。
PATは事前に作成しておく必要があります。
データソース作成
SparkSQLアダプタを使用してデータソースを以下の設定で作成します。
項目 | 内容 |
---|---|
認証スキーム | Plain |
Server | <DatabricksインスタンスURL> |
ポート | 443 |
ユーザ | token |
トランスポートモード | HTTP |
パスワード | <Databricks個人用アクセストークン(PAT)の値> |
データベース |
<接続先データベース> 本記事に示す例ではスキーマまで指定しています。 |
HTTPパス | <接続先DatabricksクラスターのHTTPパス> |
SSLの使用 | ✓をいれる |
接続テストを実施し、正常に接続できることを確認します。
イントロスペクト
クエリ実行先テーブルのメタデータを取得します。
クエリ実行
イントロスペクトされたテーブルをプレビューすることでクエリを実行します。