データアナリティクス部の大貫です。
先日、Databricks Certified Data Engineer Professional を受験し、合格しました。
本記事では下記について記載していきたいと思います。
本記事は執筆時点(2025年12月12日時点)での内容です。
本試験の内容ですが、試験ガイドによると、
「Databricks Lakehouse Platform上で本番グレードのデータエンジニアリングソリューションを構築、最適化、維持するための受験者の高度なスキルを検証します」と記載があります。
Databricksの機能に関する幅広い高度な知識や、Python や Spark、SQLについての理解が求められます。
日本語での受験が可能です。
問題の中には長文で、日本語でも理解するのに時間がかかるものもあるので、母国語で受験できるのは嬉しいですね。
日本語版では2025/11から試験内容が変更されているようです。(英語版では2025/9から変更されている模様。)
私が受験したのは2025/10ですが、変更前の内容でした。
現在受験を検討されている方はご注意ください。
主に下記のような内容が追加されているようです。
私が最初にDatabricksに触れたのは2年ほど前で、自己学習で2,3か月ぐらい軽く触りました。その後少し期間が空いて、実務で使用することになり、受験時点で約1年の使用経験がありました。
実務ではノートブック上で、pythonやSQLを使用してのデータ加工や機械学習モデルの構築などに携わっていました。そのため、Spark Structured Streamingやデータパイプライン、ジョブなどにはあまり触れたことがありませんでした。
学習で最初に取り組んだのは、試験ガイドを元に勉強ノートを作成したことです。
試験ガイドに記載されている内容について、Databricksが公開しているドキュメントなどを参考にまとめました。
一通りの勉強にはなりましたが、試験に出ない部分にも時間をかけてしまったので、あまり効率的ではなかったかもしれません。
実際にDatabricks上で確認することをお勧めします。
コードは実際に動かしてみると挙動が分かりやすいかと思います。また、Spark UI や クエリプロファイル などは実際に画面で確認すると、どういった内容が表示されるのか一目瞭然です。
公式ドキュメントは文字が多いので理解しづらい部分がありますが、画面で確認するとすぐに理解できるものも多くあります。
試験ガイドの最後に10問サンプル問題が載っています。
また、前の試験ガイドにも問題が5問載っているので、どちらもチェックしておくと良いと思います。
このサンプル問題からも類題が何問か出題されました。
こちらのUdemyの問題集を購入し、理解して解けるようになるまで繰り返しました。類題などが実際に出題されたので、購入して良かったかなと思います。
また、こちらの問題集は前述の試験内容変更にも対応されているので、これから受験予定の方にも参考になると思います。
コメント