최신Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版) - Professional-Data-Engineer日本語무료샘플문제
ACID 準拠のデータベースを必要とするシステムを設計しています。障害が発生した場合にシステムに必要な人的介入を最小限に抑える必要があります。どうすればよいでしょうか。
ユーザーにテーブルの最初の 3 列のみの読み取り権限を与えるには、どのアクセス制御方法を使用しますか?
BigQuery の静的参照データを使用して Cloud Pub/Sub のデータを強化する Apache Beam パイプラインを設計しています。 参照データは、単一のワーカーのメモリに収まるほど小さいです。 パイプラインは、分析のために強化された結果を BigQuery に書き込む必要があります。 このパイプラインでは、どのジョブタイプと変換を使用する必要がありますか。
ETL ジョブを BigQuery で実行するように移行した後、移行したジョブの出力が元のジョブの出力と同じであることを確認する必要があります。元のジョブの出力を含むテーブルをロードし、その内容を移行したジョブの出力と比較して、それらが同一であることを確認します。テーブルには、比較のために結合できる主キー列が含まれていません。
何をすべきでしょうか?
Bigtable の時系列データでホットスポットを回避するために推奨される方法はどれですか?
市内の建設現場付近に設置された数百個のセンサーから騒音レベルデータを取り込むストリーミング Dataflow パイプラインを構築しています。センサーは10秒ごとに騒音レベルを測定し、レベルが70 dBAを超えるとデータをパイプラインに送信します。センサーから30分以上データが受信されたときに平均騒音レベルを検出する必要がありますが、15分間データが受信されなかった時点でウィンドウが終了します。どうすればよいでしょうか?
Compute Engine 仮想マシン (n2-standard -32) 上の TensorFlow 機械学習モデルでは、フレーミングを完了するのに 2 日かかります。モデルには、CPU 上で部分的に実行する必要があるカスタム TensorFlow 操作が含まれています。コスト効率の高い方法でトレーニング時間を短縮したいと考えています。どうすればよいでしょうか。
あなたは経済コンサルティング会社で働いており、企業が経済動向をリアルタイムで把握できるよう支援しています。分析の一環として、Google BigQuery を使用して、顧客データと、パン、ガソリン、牛乳など、最もよく売れている 100 種類の商品の平均価格を相関させています。これらの商品の平均価格は 30 分ごとに更新されます。このデータを最新の状態に保ち、BigQuery 内の他のデータとできるだけ低コストで組み合わせられるようにしたいと考えています。どうすればよいでしょうか。
コストとパフォーマンスを考慮してクエリを最適化したい場合、データをどのように構造化すればよいでしょうか?
Pub/Sub を使用して、プッシュ サブスクリプションに依存するイベント駆動型コンシューマー アプリでクリックストリーム データを処理するメッセージング システムを設計しています。コンシューマー アプリの一時的なダウンタイムを処理できるほど信頼性の高いメッセージング システムを構成する必要があります。また、サブスクライバーが消費できない入力メッセージを保存するメッセージング システムも必要です。システムは、コンシューマー アプリの過負荷を回避しながら、失敗したメッセージを徐々に再試行し、最大 10 回の再試行後に失敗したメッセージをトピックに保存する必要があります。Pub/Sub サブスクリプションはどのように構成すればよいですか。
BigQuery Web UI から実行できる操作はどれですか?
組織では IT サービスを最新化し、Google Cloud に移行しています。Cloud Storage と BigQuery に保存するデータを整理する必要があります。営業、製品設計、マーケティングの各部門間でデータを共有するために、データ メッシュ アプローチを有効にする必要があります。何をすべきでしょうか。