Databricks Databricks-Certified-Data-Engineer-Professional日本語 Actual Free Exam Questions & Community Discussion

Exam Code/Number: Databricks-Certified-Data-Engineer-Professional日本語
Exam Name/Title: Databricks Certified Data Engineer Professional Exam (Databricks-Certified-Data-Engineer-Professional日本語版)
Certification Provider: Databricks
Corresponding Certification: Databricks Certification

Exam Questions: 250
Updated On: Jun 01, 2026

Page: 3 / 18
Total 250 questions

Get Free PDF Get Full Access Now

Question #29

データエンジニアは、S3ストレージに新しいCSVファイルが到着すると自動的に処理する効率的なパイプラインを設計する必要があります。これらの要件を満たすために、データエンジニアはどのDatabricks機能を使用すべきでしょうか？

A. 標準の Spark readStream を使用して、フォーマット ("csv") とフォーマット ("json") でクラウドストレージからストリーミングします。

B. スキーマ推論と進化が有効になっている自動ローダー

C. 処理されたファイルを追跡するためのパラメータ付きのCOPY INTO SQLコマンド

D. スケジュールされた Databricks ジョブによる従来のバッチ処理

Discussion 0

Correct Answer: B Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #30

エンドツーエンドテストの主な利点を説明している記述はどれですか。

A. すべてのコードパスとブランチのテスト範囲を提供します。

B. テストスイートの自動化が容易になります

C. アプリケーションの実際の使用状況を厳密にシミュレートします。

D. アプリケーションの構成要素内のエラーを正確に特定します。

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #31

pyspark.sql.functions.broadcast の正しい使用方法を説明している記述はどれですか?

A. 列のカーディナリティが十分に低いため、個別の値を使用可能なパーティションに適切にマッピングして、ブロードキャスト結合を可能にすることをマークします。

B. 列がすべての実行プログラムでメモリに格納できるほど小さいものとしてマークされ、ブロードキャスト結合が可能になります。

C. Databricks ワークスペース内のすべてのアクティブなクラスターのアタッチされたストレージボリュームに、指定されたテーブルのコピーをキャッシュします。

D. クラスターの有効期間中に将来のすべてのクエリで使用するために、指定されたテーブルのコピーをクラスター内のすべてのノードにキャッシュします。

E. DataFrame がすべての実行者のメモリに格納できるほど小さいものとしてマークされ、ブロードキャスト結合が可能になります。

Discussion 0

Correct Answer: E Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #32

あるデータエンジニアが、組織内の安全なデータ共有戦略を設計しています。同社は、機密性の高い顧客分析データを2つの異なるパートナーと共有する必要があります。パートナーAはUnity Catalogを有効にしたDatabricksを使用していますが、パートナーBはDatabricksを使用せずにAWS上のApache Sparkを使用しています。これらのシナリオにおいて、安全なデータ共有をどのように実装すればよいでしょうか？

A. Databricks 間共有 (D2D) は同じクラウドプロバイダー内でのみ使用できます。そのため、クロスクラウドシナリオではオープン共有 (D2O) を使用する必要があります。ユニットカタログガバナンスは、外部プラットフォームと共有する場合は利用できません。

B. セキュリティ要件が同一であるため、両方のパートナーは同じデルタ共有アプローチを使用する必要があります。最大限の互換性を確保するため、両方のパートナーに対してベアラートークンを作成し、オープン共有プロトコル (D2O) を使用する必要があります。

C. パートナーAには、ユニットカタログ統合とトークン不要の交換システムを備えたDatabricks間共有(D2D)を実装します。パートナーBには、ベアラートークンまたはOIDCフェデレーションによる認証を備えたオープン共有プロトコル(D2O)を使用し、両方のアプローチで堅牢なセキュリティとガバナンスを維持します。

D. オープン共有プロトコル(D2O)はD2D共有よりもセキュリティが高いため、両方のパートナーで使用してください。ベアラートークン方式は、Unity Catalogのネイティブ認証よりも常に安全です。

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #33

データエンジニアが、3つのノートブックをオーケストレーションするマルチタスクのDatabricksジョブをデプロイしています。1つのタスクが断続的に終了コード1で失敗しますが、再試行すると成功します。エンジニアは、失敗した試行の詳細なログ(標準出力/標準エラー出力、クラスターのライフサイクルコンテキストなど)を収集し、プラットフォームチームと共有する必要があります。データエンジニアは、組み込みツールを使用してどのような手順を実行する必要がありますか？

A. ジョブ実行の詳細ページから、ジョブのログをエクスポートするか、ログ配信を構成します。次に、コンピューティングの詳細ページからコンピューティングドライバーログとイベントログを取得して、stdout/stderr をクラスターイベントと関連付けます。

B. ノートブックの実行結果を HTML にエクスポートします。このバンドルには、すべてのタスクにわたる完全な stdout、stderr、およびクラスターイベント履歴が含まれます。

C. ノートブックの対話型デバッガーを使用して、マルチタスクジョブ全体を再実行し、失敗したタスクのステップスルートレースをキャプチャします。

D. ワーカーログにはすべてのタスクとクラスターイベントの stdout/stderr が含まれているため、Spark UI からワーカーログを直接ダウンロードし、ドライバーログは無視します。

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #34

ほぼリアルタイムのワークロードを容易にするために、データエンジニアはDatabricks Auto Loaderのスキーマ検出および進化機能を活用するヘルパー関数を作成しています。この関数は、ソースのスキーマを自動で直接検出し、ソースディレクトリにJSONファイルが到着すると段階的に処理し、新しいフィールドが検出されるとテーブルのスキーマを自動的に進化させます。
関数は以下に空白で表示されます。

指定された要件を満たすために空欄を正しく埋める回答はどれですか?

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #35

データエンジニアは、遅れて到着する重複レコードが表示される可能性があるパイプラインを構成しています。
バッチ内のレコードの重複排除に加えて、デルタテーブルに挿入されるときに、データエンジニアが以前に処理されたレコードに対してデータの重複排除を実行できるアプローチは次のどれですか。

A. 一意のキーで完全外部結合を実行し、既存のデータを上書きします。

B. 構成 delta.deduplicate = true を設定します。

C. 一意のキーに対して一致する条件を使用して挿入のみのマージを実行します。

D. Delta Lake スキーマの適用を利用して、重複レコードを防止します。

E. 各バッチが完了した後、Delta テーブルを VACUUM します。

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #36

データエンジニアは、パイプラインに直接接続されたDatabricksノートブックを使用して、Lakeflow宣言型パイプライン(LDP)を開発しています。ノートブックに新しいテーブル定義と変換ロジックを追加した後、実際にデータを処理したりパイプラインを実行したりすることなく、パイプラインコードに構文エラーがないかチェックしたいと考えています。データエンジニアはこの構文チェックをどのように実行すればよいでしょうか？

A. コード検証機能にアクセスするには、ノートブックをパイプラインから切断し、コンピューティングクラスターに再接続します。

B. 検証および診断ツールにアクセスするには、ノートブックではなくワークスペースファイルに切り替えます。

C. ノートブックから Web ターミナルを開き、シェルコマンドを実行してパイプラインコードを検証します。

D. ノートブックの「検証」オプションを使用して、構文エラーがないか確認します。

Discussion 0

Correct Answer: D Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #37

データエンジニアがDatabricks上にトランザクションデルタテーブルを作成しました。これはアナリティクスチームが使用する予定です。アナリティクスチームは、Apache Iceberg形式を必要とする別のツールでこのテーブルを使用したいと考えています。データエンジニアはどうすればよいでしょうか？

A. トランザクションの Delta テーブルを Iceberg に変換し、テーブルを Delta テーブルとして読み取れるように uniform を有効にします。

B. 分析チームが使用できるトランザクションデルタテーブルの Iceberg コピーを作成します。

C. 分析チームに Delta テーブルをサポートするツールの使用を要求します。

D. トランザクションテーブルを Iceberg テーブルとして読み取れるように、テーブルを 'iceberg' に uniform を有効にします。

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #38

データエンジニアは、遅延到着が頻発するKafkaストリームのレコードを処理するDatabricksパイプラインを設計しています。データエンジニアはどのようなアプローチを採用すべきでしょうか？

A. バッチテーブルで自動 CDC パイプラインを使用して、遅延データの処理を簡素化します。

B. バッチ処理を使用して、出力テーブル全体を毎回上書きし、遅延データが正しく組み込まれるようにします。

C. Databricks ジョブを使用してカスタムソリューションを実装し、すべての履歴データを定期的に再処理します。

D. ウォーターマークを使用して、予想されるウィンドウの後に到着するレコードに対応するために許容される遅延を指定し、正しい集計と状態管理を保証します。

Discussion 0

Correct Answer: D Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #39

Unity Catalog でデータエンジニアリングワークスペースが自動的に有効化され、ワークスペースカタログが作成されました。新しいチームメンバーから、デフォルトスキーマではテーブルを作成できるものの、同じワークスペースカタログ内の他のスキーマのテーブルにアクセスできないという報告がありました。なぜ新しいチームメンバーは他のスキーマのテーブルにアクセスできないのでしょうか？

A. 他のスキーマのテーブルでは、新規ユーザーには自動的に付与されない追加のBROWSE権限が必要です。

B. ワークスペースカタログの権限は継承ルールの対象ではありません。

C. ワークスペースユーザーに、USE CATALOG およびデフォルトのスキーマに対する特定の権限のみが付与されます。

D. 新しいユーザーには、デフォルトのスキーマに対する CREATE TABLE 権限のみが付与されます。

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #40

データエンジニアリングチームのメンバーが、より大規模なデータパイプラインの一部としてスケジュール設定したいという短いノートブックを提出しました。以下のコマンドは、提示されているとおりに実行した場合に論理的に正しい結果を生成するものと仮定します。

ジョブとしてスケジュールする前にノートブックから削除する必要があるコマンドはどれですか?

A. コマンド3

B. コマンド 5

C. コマンド6

D. コマンド4

E. コマンド2

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #41

ある企業は、従来のDatabricksジョブでAuto Loaderを使用して、外部ソースからの半構造化JSONファイルを処理しています。時折、重要なフィールドがNULL、無効な型、または予期しないネストされたスキーマのバリエーションを持つレコードが到着します。エンジニアは、不正な形式または不適合なレコードが警告なく削除されず、別の検疫テーブルにキャプチャされるようにする必要があります。パイプラインは、ジョブを失敗させることなく、正常なレコードをブロンズレイヤーに処理し続ける必要があり、バッチとストリーミングの両方の取り込みをサポートする必要があります。
データエンジニアは、不良レコードを検疫 Delta テーブルに自動的にルーティングする一方で、良好なレコードを Bronze レイヤーに取り込んでさらに処理する、堅牢な取り込みパターンを構築する必要があります。
この取り込みアーキテクチャにおける検疫メカニズムを実現するアプローチはどれですか?

A. Lakeflow Spark 宣言型パイプラインを SQL パイプラインで使用し、critical_fields が null でない場合に null を含む行を削除するように構成し、不正な形式のデータについては監査ログに依存します。

B. LDP で Auto Loader を使用し、レコード監査ロジックを含む EXPECT () 制約を実装して、不良レコードをルーティングします。

C. Auto Loader を failFast モードで使用して false に設定し、スキーマの進化を有効にします。無効なレコードは取り込み中に黙って無視されます。

D. inferSchema=True でノートブックジョブを作成し、.foreachBatch() を使用してストリーミングクエリを記述し、try/except を使用して例外をキャッチし、失敗したバッチを検疫にリダイレクトします。

Discussion 0

Correct Answer: B Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Question #42

データエンジニアは、display(df.collect()) から結果を出力する前に、多数の変換を含むインタラクティブノートブックで作業しています。ノートブックには、ワイド変換とクロス結合が含まれています。
データエンジニアが次のエラーを受け取りました: 「Spark ドライバーが予期せず停止したため、再起動しています。ノートブックは自動的に再接続されます。」データエンジニアはどのようなアクションを実行する必要がありますか?

A. コンピューティングメトリック UI を調べて、エグゼキューターのメモリ使用率が 90% を超えているかどうかを確認します。

B. ドライバーが落ちないように、ノートブックを単一ノードクラスターで実行します。

C. Spark UI をチェックして、エグゼキューターの数が少なくなったため、各ステージに割り当てられているジョブの数を確認します。

D. ドライバーノードにメモリ負荷がかからないようにコードを書き直します。

Discussion 0

Correct Answer: D Vote an answer

Explanation: Only visible for EduDump members. You can sign-up / login (it's free).

Page: 3 / 18
Total 250 questions

Previous Page Next Page

Unlock all Databricks-Certified-Data-Engineer-Professional日本語 features

No captcha needed
365 Days Free Updates
Set your Desired Pass Percentage
Allocate Time (Hours : Minutes)
Two Modes For Databricks-Certified-Data-Engineer-Professional日本語 Practice
Customer Support

Get Full Access Now

Download Free Databricks Databricks-Certified-Data-Engineer-Professional日本語 Demo

Simply submit your e-mail address below to get started with our free demo of your Databricks Databricks-Certified-Data-Engineer-Professional日本語 exam.

Email Address:

Our demo shows only a few questions from your selected exam for evaluating purposes.

0 Community Members

0 Shares

0 Demo Downloads

10 Years in Business