최신Amazon AWS Certified Machine Learning Engineer - Associate (MLA-C01日本語版) - MLA-C01日本語무료샘플문제
ML エンジニアは、Amazon SageMaker を使用して、分散トレーニングを必要とするディープラーニング モデルをトレーニングしています。
何度かトレーニングを試行した後、MLエンジニアはインスタンスが期待どおりに動作していないことに気づきました。MLエンジニアは、トレーニングインスタンス間の通信オーバーヘッドを特定しました。
インスタンス間の通信オーバーヘッドを最小限に抑えるために、ML エンジニアは何をすべきでしょうか?
ある企業は、新規に作成されたVPCのパブリックサブネットでAmazon SageMakerドメインを運用しています。ネットワークは適切に構成されており、MLエンジニアはSageMakerドメインにアクセスできます。
最近、特定のIPアドレスからドメインへの不審なトラフィックを発見しました。当社は、特定のIPアドレスからのトラフィックをブロックする必要があります。
この要件を満たすネットワーク構成の更新はどれですか?
ある企業は、機械学習のトレーニング用データを保存するためにNFSベースのデータストアを使用している。Linuxベースのシステムがこのデータストアにアクセスする。
同社は、共有データストアをオンプレミスサーバーと、データを利用するAmazon SageMaker AIノートブックの両方からアクセスできるようにするハイブリッドシステムを必要としている。データ生成者にはファイルロック機能が必要である。
これらの要件を満たすAWSストレージソリューションはどれでしょうか?
MLエンジニアは、Amazon SageMakerを使用して、テキスト要約用の大規模言語モデル(LLM)を微調整する必要があります。MLエンジニアは、ローコード・ノーコード(LCNC)アプローチを採用する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
機械学習エンジニアはAmazon SageMaker AIを使用して機械学習モデルをトレーニングしています。機械学習エンジニアは、SageMaker AIの自動モデルチューニング(AMT)機能を使用して、大規模なパラメータ空間にわたってモデルのハイパーパラメータを調整する必要があります。
このモデルには、チューニング可能な20個のカテゴリハイパーパラメータと7個の連続ハイパーパラメータがあります。MLエンジニアは、チューニングジョブを最大1,000回実行する必要があります。MLエンジニアは、各パラメータ試行が前回の試行のパフォーマンスに基づいて構築されていることを確認する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
MLエンジニアは、AWS Glue DataBrewの最小最大正規化を用いてトレーニングデータを正規化しました。MLエンジニアは、本番環境の推論データをモデルに渡す前に、同様の方法で正規化する必要があります。
どのソリューションがこの要件を満たすでしょうか?
ある企業が Amazon Athena を使用して Amazon S3 内のデータセットをクエリしています。データセットには、企業が予測したいターゲット変数が含まれています。
企業は、モデルがターゲット変数を予測できるかどうかを判断するために、ソリューションでデータセットを使用する必要があります。
最も少ない開発労力でこの情報を提供できるソリューションはどれでしょうか?
ある企業は、Amazon SageMaker を使用して予測機械学習モデルを本番環境にデプロイしました。このモデルでは SageMaker Model Monitor を使用しています。モデルの更新後、機械学習エンジニアは Model Monitor のチェックでデータ品質の問題に気づきました。
Model Monitor によって特定されたデータ品質の問題を軽減するために、ML エンジニアは何をすべきでしょうか?
ある企業が、コンテナにパッケージ化された機械学習モデルをトレーニングしました。同社はこのモデルを既存のPythonウェブアプリケーションに統合する予定です。同社はKubernetesを使用してAWS上にモデルをホストする必要があります。
同社はコントロールプレーンの管理を望まず、リソースを再現可能な方法でプロビジョニングする必要がある。インフラストラクチャはPythonを使用してプロビジョニングされなければならない。
これらの要件を満たすソリューションはどれでしょうか?
ある企業は、Amazon SageMaker Studio を使用して機械学習モデルを開発しています。この企業には単一の SageMaker Studio ドメインがあります。機械学習エンジニアは、SageMaker AI のコンピューティングコストが特定のしきい値に達した場合に自動アラートを通知するソリューションを実装する必要があります。
これらの要件を満たすソリューションはどれでしょうか?
ある企業は、複数のソースからデータを統合する必要があります。Amazon Redshift Serverless を使用して、AWS Glue データカタログデータベースと、Amazon S3 バケットに保存されている基礎データにクエリを実行する必要があります。
以下のリストから、これらの要件を満たす正しい手順を選択し、順番に並べます。各手順を1回ずつ選択するか、まったく選択しないでください。(3つ選択して順番に並べます。)
* IAM ロールを Redshift クラスターにアタッチします。
* IAM ロールを Redshift 名前空間にアタッチします。
* Amazon Redshift にデータカタログスキーマを指す外部データベースを作成します。
* Amazon Redshift でデータカタログ データベースを指す外部スキーマを作成します。
* 基盤となるデータを含む S3 バケットにのみアクセスするために使用する Amazon Redshift の IAM ロールを作成します。
* Amazon Redshift がデータカタログと基礎となるデータを含む S3 バケットにアクセスするために使用する IAM ロールを作成します。


Explanation:
Step 1
Create an IAM role for Amazon Redshift to use to access the Data Catalog and the S3 bucket that contains underlying data.
This role must include:
Permissions for AWS Glue Data Catalog (e.g., glue:GetDatabase, glue:GetTables) Permissions for the Amazon S3 bucket that stores the underlying data Step 2 Attach the IAM role to the Redshift namespace.
Redshift Serverless uses a namespace, not a cluster, so the role must be associated with the namespace to allow Redshift to assume it when querying external data.
Step 3
Create an external schema in Amazon Redshift to point to the Data Catalog database.
The external schema maps Redshift to the Glue Data Catalog database so Redshift can query the tables stored in S3.
カスタマーコールセンターは、Amazon Transcribeを使用して、顧客とサポート担当者間の数百件の音声録音をテキストファイルに変換しています。コールセンターは、これらのテキストファイルを使用して機械学習モデルをトレーニングしたいと考えています。業界規制を遵守するため、コールセンターはトレーニング用テキストファイルから顧客名、住所、電話番号を削除する必要があります。
開発労力を最小限に抑えつつ、これらの要件を満たすソリューションはどれでしょうか?
機械学習エンジニアは複数の機械学習モデルを評価しており、本番環境で使用するモデルを1つ選択する必要があります。これらのモデルによる偽陰性予測のコストは、偽陽性予測のコストよりもはるかに高くなります。
ML エンジニアがモデルを選択する際に最も優先すべきメトリックの検出は何ですか?
ある企業では、本番環境エンドポイントに既存の Amazon SageMaker AI モデル (v1) を運用しています。この企業は新しいモデルバージョン (v2) を開発しており、v1 を v2 に置き換える前に本番環境で v2 をテストする必要があります。
企業は、v2 が本番環境で誤った出力を生成するリスクを最小限に抑える必要があり、変更中に本番環境のトラフィックが中断されるのを防ぐ必要があります。
これらの要件を満たすソリューションはどれでしょうか?