최신Databricks Certified Professional Data Engineer Exam (Databricks-Certified-Professional-Data-Engineer Korean Version) - Databricks-Certified-Professional-Data-Engineer Korean무료샘플문제
거래 테이블이 product_id, user_id 및 event_date 열을 기준으로 Liquid 클러스터링되었습니다.
쓰기 시 클러스터링을 지원하지 않는 작업은 무엇입니까?
신입 데이터 엔지니어가 관계형 데이터베이스 시스템의 워크로드를 Databricks Lakehouse로 마이그레이션하고 있습니다. 소스 시스템은 스타 스키마를 사용하며, 외래 키 제약 조건과 다중 테이블 삽입을 활용하여 레코드 쓰기 시 유효성을 검사합니다.
이 워크로드를 마이그레이션하는 동안 엔지니어의 결정에 영향을 미치는 고려 사항은 무엇입니까?
user_ltv라는 이름의 테이블은 여러 팀의 데이터 분석에 사용될 뷰를 생성하는 데 사용되고 있습니다.
워크스페이스의 사용자들은 그룹으로 구성되며, 이 그룹은 ACL을 사용하여 데이터 접근 권한을 설정하는 데 사용됩니다.
user_ltv 테이블은 다음과 같은 스키마를 가지고 있습니다.

다음 쿼리를 실행하는 감사 그룹의 구성원이 아닌 사람을 분석합니다.

이 쿼리의 결과는 무엇일까요?
Databricks Python 노트북을 텍스트 편집기에서 볼 때 첫 번째 내용은 무엇입니까?
DLT 파이프라인에는 다음과 같은 스트리밍 테이블이 포함됩니다.
Raw_lot은 심박수 추적 장치에서 원시 장치 측정 데이터를 수집합니다.
Bgm_stats는 raw_lot의 BPM 측정값을 기반으로 사용자 통계를 점진적으로 계산합니다.
데이터 엔지니어는 파이프라인 업데이트 실행 시 하위 테이블을 다시 계산하는 동안 raw_iot 테이블에서 수동으로 삭제되거나 업데이트된 레코드를 유지할 수 있도록 이 파이프라인을 어떻게 구성해야 할까요?
Databricks Auto Loader의 기본 실행 모드를 설명하는 문장은 무엇입니까?
저장 및 컴퓨팅 비용을 줄이기 위해 데이터 엔지니어링 팀은 비즈니스 인텔리전스 대시보드, 고객 대면 애플리케이션, 프로덕션 머신 러닝 모델 및 임시 분석 쿼리에서 활용되는 일련의 집계 테이블을 관리하는 임무를 맡았습니다.
데이터 엔지니어링 팀은 고객 대면 애플리케이션에서 새로운 요구 사항이 발생했음을 알게 되었습니다. 이 애플리케이션은 해당 팀이 전적으로 관리하는 유일한 하위 워크로드입니다. 따라서 조직 전체의 여러 팀에서 사용하는 집계 테이블의 필드 이름을 변경하고 새 필드를 추가해야 합니다.
관리해야 할 테이블 수를 늘리지 않으면서 조직 내 다른 팀에 미치는 영향을 최소화하는 해결책은 무엇입니까?
의료 분석 팀이 환자 진료 분석을 위해 Delta Lake에 차원 모델을 구현하고 있습니다.
그들은 날짜 차원 테이블을 가지고 있으며, 다양한 시간 기반 분석을 지원할 수 있도록 설계 옵션을 평가하고 있습니다.
시간 기반 쿼리 및 집계를 효율적으로 지원하려면 날짜 차원에 대해 어떤 설계 접근 방식을 취해야 할까요?
비즈니스 보고 시스템에서는 대시보드 데이터가 매시간 업데이트되어야 합니다. 데이터 추출, 변환 및 로드를 담당하는 파이프라인의 총 처리 시간은 10분입니다.
정상적인 운영 조건을 가정할 때, 어떤 구성이 가장 낮은 비용으로 서비스 수준 계약 요구 사항을 충족할까요?
미국에 본사를 둔 한 소규모 회사가 최근 인도의 컨설팅 회사와 계약을 맺고 인공지능 애플리케이션에 필요한 여러 새로운 데이터 엔지니어링 파이프라인을 구축하기로 했습니다. 이 회사의 모든 데이터는 미국 내 지역 클라우드 스토리지에 저장됩니다.
회사 워크스페이스 관리자는 계약직 직원들이 사용하는 Databricks 워크스페이스를 어디에 배포해야 할지 확신하지 못하고 있습니다.
모든 데이터 거버넌스 고려 사항을 감안할 때, 다음 중 어떤 설명이 이 결정에 정확한 근거를 제시합니까?
주니어 데이터 엔지니어가 Databricks REST API 엔드포인트 2.0/jobs/create에 다음 JSON을 게시하는 워크로드를 구성했습니다.

모든 구성 및 참조된 리소스를 사용할 수 있다고 가정할 때, 이 워크로드를 세 번 실행했을 때의 결과를 설명하는 문장은 무엇입니까?