Google인증 실제 시험문제, Professional-Data-Engineer日本語 덤프문제집

문제1
ACID 準拠のデータベースを必要とするシステムを設計しています。障害が発生した場合にシステムに必要な人的介入を最小限に抑える必要があります。どうすればよいでしょうか。

A. ポイントインタイムリカバリを有効にして Cloud SQL for MySQL インスタンスを構成します。

B. マルチリージョン構成で BJgQuery テーブルを構成します。

C. 複数のクラスタを持つ Bigtable インスタンスを構成します。

D. 高可用性を有効にして Cloud SQL for PostgreSQL インスタンスを構成します。

정답: D

설명: (ITDumpsKR 회원만 볼 수 있음)

문제2
ユーザーにテーブルの最初の 3 列のみの読み取り権限を与えるには、どのアクセス制御方法を使用しますか?

A. 定義済みロール

B. 承認されたビュー

C. プリミティブロール

D. テーブルの最初の 3 列のみにアクセス権を付与することはできません。

정답: B

설명: (ITDumpsKR 회원만 볼 수 있음)

문제3
BigQuery の静的参照データを使用して Cloud Pub/Sub のデータを強化する Apache Beam パイプラインを設計しています。参照データは、単一のワーカーのメモリに収まるほど小さいです。パイプラインは、分析のために強化された結果を BigQuery に書き込む必要があります。このパイプラインでは、どのジョブタイプと変換を使用する必要がありますか。

A. バッチジョブ、PubSubIO、サイド入力

B. ストリーミングジョブ、PubSubIO、BigQueryIO、副出力

C. ストリーミングジョブ、PubSubIO、JdbcIO、サイド出力

D. ストリーミングジョブ、PubSubIO、BigQueryIO、副入力

정답: D

문제4
ETL ジョブを BigQuery で実行するように移行した後、移行したジョブの出力が元のジョブの出力と同じであることを確認する必要があります。元のジョブの出力を含むテーブルをロードし、その内容を移行したジョブの出力と比較して、それらが同一であることを確認します。テーブルには、比較のために結合できる主キー列が含まれていません。
何をすべきでしょうか?

A. OVER() 関数を使用して層別ランダムサンプルを作成し、各テーブルから同等のサンプルを比較します。

B. RAND() 関数を使用してテーブルからランダムなサンプルを選択し、サンプルを比較します。

C. Dataproc クラスタと BigQuery Hadoop コネクタを使用して各テーブルからデータを読み取り、並べ替え後にテーブルのタイムスタンプ以外の列からハッシュを計算します。各テーブルのハッシュを比較します。

D. HASH() 関数を使用してテーブルからランダムなサンプルを選択し、サンプルを比較します。

정답: D

문제5
Bigtable の時系列データでホットスポットを回避するために推奨される方法はどれですか?

A. ハッシュ

B. 塩漬け

C. フィールドの昇格

D. ランダム化

정답: C

설명: (ITDumpsKR 회원만 볼 수 있음)

문제6
市内の建設現場付近に設置された数百個のセンサーから騒音レベルデータを取り込むストリーミング Dataflow パイプラインを構築しています。センサーは10秒ごとに騒音レベルを測定し、レベルが70 dBAを超えるとデータをパイプラインに送信します。センサーから30分以上データが受信されたときに平均騒音レベルを検出する必要がありますが、15分間データが受信されなかった時点でウィンドウが終了します。どうすればよいでしょうか？

A. 15 分間のウィンドウと 30 分の周期でホッピングウィンドウを使用します。

B. 30 分間のギャップ期間を持つセッションウィンドウを使用します。

C. 15 分のギャップ期間を持つセッションウィンドウを使用します。

D. 15 分間のウィンドウと 15 分のタンブリングウィンドウを使用します。withAllowedLateness 演算子。

정답: C

설명: (ITDumpsKR 회원만 볼 수 있음)

문제7
Compute Engine 仮想マシン (n2-standard -32) 上の TensorFlow 機械学習モデルでは、フレーミングを完了するのに 2 日かかります。モデルには、CPU 上で部分的に実行する必要があるカスタム TensorFlow 操作が含まれています。コスト効率の高い方法でトレーニング時間を短縮したいと考えています。どうすればよいでしょうか。

A. TPUハードウェアアクセラレータを備えたVMを使用してモデルをトレーニングする

B. VMタイプをe2 standard-32に変更します

C. VMタイプをn2-highmem-32に変更します

D. GPUハードウェアアクセラレータを備えたVMを使用してモデルをトレーニングする

정답: D

문제8
あなたは経済コンサルティング会社で働いており、企業が経済動向をリアルタイムで把握できるよう支援しています。分析の一環として、Google BigQuery を使用して、顧客データと、パン、ガソリン、牛乳など、最もよく売れている 100 種類の商品の平均価格を相関させています。これらの商品の平均価格は 30 分ごとに更新されます。このデータを最新の状態に保ち、BigQuery 内の他のデータとできるだけ低コストで組み合わせられるようにしたいと考えています。どうすればよいでしょうか。

A. リージョンの Google Cloud Storage バケットにデータを保存および更新し、BigQuery にフェデレーションデータソースを作成します。

B. 30 分ごとにデータを BigQuery の新しいパーティションテーブルに読み込みます。

C. データを Google Cloud Datastore に保存します。Google Cloud Dataflow を使用して BigQuery にクエリを実行し、プログラムによってデータを Cloud Datastore に保存されているデータと結合します。

D. リージョンの Google Cloud Storage バケット内のファイルにデータを保存します。Cloud Dataflow を使用して BigQuery にクエリを実行し、プログラムによってデータを Google Cloud Storage に保存されているデータと結合します。

정답: B

문제9
コストとパフォーマンスを考慮してクエリを最適化したい場合、データをどのように構造化すればよいでしょうか?

A. テーブルデータをcreate_date、location_id、device_versionでパーティション分割します。

B. create_date location_id および device_version でテーブルデータをクラスタ化します。

C. テーブルデータをcreate_dateでパーティション化し、テーブルデータをlocation_Idとdevice_versionでクラスター化する

D. create_date でテーブルデータをクラスタ化し、locationed と device_version でパーティション化する

정답: C

문제10
Pub/Sub を使用して、プッシュサブスクリプションに依存するイベント駆動型コンシューマーアプリでクリックストリームデータを処理するメッセージングシステムを設計しています。コンシューマーアプリの一時的なダウンタイムを処理できるほど信頼性の高いメッセージングシステムを構成する必要があります。また、サブスクライバーが消費できない入力メッセージを保存するメッセージングシステムも必要です。システムは、コンシューマーアプリの過負荷を回避しながら、失敗したメッセージを徐々に再試行し、最大 10 回の再試行後に失敗したメッセージをトピックに保存する必要があります。Pub/Sub サブスクリプションはどのように構成すればよいですか。

A. サブスクリプション再試行ポリシーとして即時再配信を使用し、最大配信試行回数を 10 に設定して別のトピックへの配信不能メッセージ処理を構成します。

B. サブスクリプション再試行ポリシーとして指数バックオフを使用し、最大配信試行回数を 10 に設定して同じソーストピックへの配信不能メッセージ処理を構成します。

C. 確認応答期限を 10 分に延長します。

D. サブスクリプション再試行ポリシーとして指数バックオフを使用し、最大配信試行回数を 10 に設定して別のトピックへの配信不能メッセージ送信を構成します。

정답: D

문제11
BigQuery Web UI から実行できる操作はどれですか?

A. 20 MB のファイルをアップロードします。

B. ワイルドカードを使用して複数のファイルをアップロードします。

C. SQL 形式でファイルをアップロードします。

D. ネストされたフィールドと繰り返しフィールドを含むデータをロードします。

정답: D

설명: (ITDumpsKR 회원만 볼 수 있음)

문제12
組織では IT サービスを最新化し、Google Cloud に移行しています。Cloud Storage と BigQuery に保存するデータを整理する必要があります。営業、製品設計、マーケティングの各部門間でデータを共有するために、データメッシュアプローチを有効にする必要があります。何をすべきでしょうか。

A. 1 各部門のアプリケーションのデータ保存用に複数のプロジェクトを作成します。
2 各部門が Cloud Storage バケットと BigQuery データセットを作成できるようにします。
3. 各部門が共有したデータを Analytics Hub で公開します。
4 すべての部門が Analytics Hub で必要なデータを検出し、サブスクライブできるようにします。

B. 1各部門のデータを保存するためのプロジェクトを作成します。
2 各部門が Cloud Storage バケットと BigQuery データセットを作成できるようにします。
3. 各バケットとデータセットの承認された読者のユーザーグループを作成します。
4 IT チームがユーザーグループを管理し、部門の要求に応じてユーザーを追加または削除できるようにします。

C. 1組織のデータ保存用のプロジェクトを作成します。
2 各部門のファイルを保存するための 3 つのフォルダを含む中央 Cloud Storage バケットを作成します。
3. 部門名をプレフィックスとするテーブルを含む中央 BigQuery データセットを作成します。
4 部門のユーザーにストレージプロジェクトの閲覧権限を付与します。

D. 1 各部門のアプリケーションのデータ保存用に複数のプロジェクトを作成します。
2 各部門が Cloud Storage バケットと BigQuery データセットを作成できるようにします。
3 Dataplex で、各部門をデータレイクと Cloud Storage バケットにマッピングし、BigQuery データセットをゾーンにマッピングします。
4 各部門がデータレイクのデータを所有し、共有できるようにします。

정답: A

설명: (ITDumpsKR 회원만 볼 수 있음)

최신Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版) - Professional-Data-Engineer日本語무료샘플문제

자격증의 중요성:

ITDumpsKR 제품의 가치:

무료샘플 받아보기:

완벽한 서비스 제공:

유용한 링크

인기 시험

우리와 연락하기