「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
資格取得:2024/9
- AIの分野は技術進歩が活発では頻繁に変更されているため。
- 認定プログラムに含まれるが試験で出題されない「グレー網掛:オプション(出題対象外)」が存在する。
- 以下は、1.0-1.1で出題範囲から削除された項目だが、認定プログラムによっては教材から「削除していない」。
【応用数学】
◆線形代数
◇特異値分解
【機械学習】
◆機械学習の基礎
◇教師あり学習アルゴリズム
◇教師なし学習アルゴリズム
◇確率的勾配降下法
【深層学習】
◆順伝播型ネットワーク
◇アーキテクチャの設計
◇誤差逆伝搬法およびその他の微分アルゴリズム ※以下のみ
・全結合 MLP での誤差逆伝搬法
◆深層モデルのための最適化
◇基本的なアルゴリズム ※以下のみ
・ネステロフのモメンタム
◆畳み込みネットワーク
◇構造出力
◇データの種類
◇効率的な畳み込みアルゴリズム
◆回帰結合型ニューラルネットワークと再帰的ネットワーク
◇回帰結合型のニューラルネットワーク ※以下のみ
・教師強制と出力回帰のあるネットワーク
・有向グラフィカルモデルとしての回帰結合型のネットワーク
・RNNを使った文脈で条件付けされた系列モデリング
◇深層回帰結合型のネットワーク
◇再帰型ニューラルネットワーク
◇複数時間スケールのための Leaky ユニットとその他の手法 ※以下のみ
・時間方向にスキップ接続を追加
・接続の削除
◆深層学習の適応方法
◇画像認識
・VGG
について思う事。
コンテンツ †
- 認定プログラムによっては内容が異なると思われ、不安がある。
- 認定プログラムのコンテンツでは理解できずネットを参照している時間が長かった。
- 認定プログラムを完了してからシラバスを眺めても解らないモノが多々ある状態。
- 認定プログラムを完了してから黒本を眺めても解らない問題が多々ある状態。
- 認定プログラムはシラバスの「グレー網掛:オプション(出題対象外)」も含んでいる。
- 認定プログラムには試験に出ないプログラム実習も長時間あり、足切り的な意味もありそう。
(ただし、実務的にはプログラム実習の方が圧倒的に役に立つが)
認定の感想 †
- 以下の様な感想がWeb上にあり、所詮は足切り用と言う感もある。
- 値段相応なのか、資料は統一性が無く、突貫でかき集めたような内容。
- 2業者のプログラムを受講したが、業者次第で、網羅性が異なっている。
- 終了試験、終了試験直後の状況は3-4割の正答率
- 事例A:認定プログラム終了試験では初見で解ける問題が3割程度という感触だった。
- 事例B:認定プログラム修了後に黒本をやったら正答率は5割に届かない壊滅的な理解度だった。
- 事例C:認定プログラムは修了できたものの、E資格の黒本をやった結果、
正答率が4割程度かつ、回答を見ても理解に時間がかかるといった絶望的な状況。
- 特に、認定プログラム終了時に足りないと感じている部分
- 応用数学(
逆行列、固有値、特異値、ベイズ統計、情報量系)
- 講義を聞いたダケだと計算・得点できない。
- 修了試験~本試験対策でようやく暗記スべき計算の手順を見い出せる。
- 更にネット上で勉強を進めると概念的にも理解できるようになってくる。
- 基礎のDNN、CNN、RNNなどの基本要素
・認定プログラムのコンテンツ側が丁寧に説明しているかと言えばそうではない。
・コンテンツだけでは心もとないのでカサゴの本を使って理解するもソレだけでは得点できない。
・例えば、CNNのim2colの問題などは本試験対策として象徴的ではある。
- 高難易度の問は想定問題と独自学習の対策の併用が必要?
・言語モデルやTransformerについては深く理解したが、其々にソレだけのコストを払うのは難しそう。
・高度なモデル、物体検出系、領域検出系、AE系、GAN系、深層強化学習系
・その他モデル、GNN、GCN、距離学習、メタ学習。
- 認定プログラム中の「試験対策」は黒本より内容が圧倒的に薄い。
修了者ナンバー †
認定プログラムを完了すると入手できるはずだが、e-learningが完了していても自動的に発行されないものが多いので注意する。
- ある認定プログラムでは、e-learning完了後にWeb上の試験に合格して修了者ナンバー依頼を出す。
- ある認定プログラムでは、e-learningの巻末にある認定テストに合格するだけではなく、レポート提出なども必要で紛らわしい。
- 修了者ナンバーは直近の試験日に合わせると、認定プログラム終了の1ヶ月前位に全要件を満たして申請する必要がある。
- 認定プログラム完了後の4択試験の正答率が3-4割と考えると、1ヶ月前認定を受け1ヶ月で対策するスケジュールは難しい。
※ 余談だが2024/2に取得した終了者ナンバーは3万5千番代だったが合格者数は、8千人未満で、認定取得も、資格取得していない人が相当数居る事が解る。
しかし、資格合格率は6割程度と高いので、その計算だと、2万人以上は合格者が居てもおかしくはないが、実際は、認定者の2割の8千人程度に留まっている。
実際に、認定取得後、黒本チャレンジしても、3割程度しか特典できないので、更にココから、1か月程度の学習が必要になる黒本周回が必要になるので、受験していない人も多そう。
試験対策 †
- 試験はCBTでありググれないので暗記が必要な所は暗記が必要になる。
- 数学的なバックグラウンド(理解)を持っていないと、学習に時間がかかる。
- が、高校数学までの数学知識の一部、大学教養レベルで、文系でもなんとなかる。
- が、深い下位スタックには理工系の大学数学レベルの知識が必要になる部分もある。
- ただ、試験は4択なので、概念的、上位スタックを理解しておけば回答は可能。
- 範囲はG検定より狭いが(思ったより広く且つ)深い。
- 故に体積的にはE資格の方が大きく、且つ、難易度は高い印象。
- 実務で使用しない数学的理解やライブラリ内部の実装も問われる。
- 更に高難易度の問が多いので、対策以前の勉強自体も想定問題が中心になる。
勉強方法 †
- シラバスに沿った学習は、先ずは、認定プログラムで行うことになる。
- 改定タイミングに依存するが黒本より認定プログラムの方が最新のシラバスに沿っている。
- 著名な対策業者書籍の黒本は問題提示後に各問題の解説を行うスタイルになっている。
- 認定プログラムのコンテンツ、修了試験、本試験対策は別物と考えた方が良い。
- オススメの試験の勉強方法は黒本を解く事で、講座の復習はオススメされていない。
- 認定プログラムで認定を取った後は、以下を留意して黒本での試験対策を行う。
- 認定プログラム中の「試験対策」は黒本より内容が薄い(分量的な意味で)。
- 認定プログラムはシラバスの「グレー網掛:オプション(出題対象外)」も含んでいる。
黒本での試験対策 †
- 3・4周やれば十分合格できる。7周で100%に到達するらしい(と言われていたが、過去形かもしれない)。
- 1周、
20時間1ヶ月程度、後半は3時間半日程度で1周できるらしい。
- その状態で正解率は80-90%弱で合格(合格ライン65%)。
- 最近は、黒本からの出題が減り、認定プログラムからの出題が増えているらしい。
- シラバスの変更に黒本が追い付いていない(高度な深層学習の問題が増えている)。
- 2022年8月の時点で問題集第2版(2022年2月以前の範囲)がカバーしていたのは全体の60~70%
- カバー範囲外はどの様に勉強するか?(認定プログラムの試験対策があるがシラバス変更がされた場合はどうするか?)
Python †
について、
- 黒本の巻末の知識集が役立つ。
- 行列演算がキーとなる。axisの方向など。
数学には †
ビビらなくて良い。
シラバスにはない。
応用以降はシラバスにある。
<行列>
- 行列計算は機械学習・深層学習で必要。
- 機械学習の簡単な最小二乗法は逆行列で解ける。
- 深層学習の順伝播、逆伝播は行列計算の塊。
- 固有値分解
- 主成分分析(PCA)
- グラフベースのクラスタリング
- スペクトルクラスタリング
- 特異値分解
- 主成分分析(PCA)
- データ圧縮
- 協調フィルタリング
<最適化>
- 最尤法は、
- 対数尤度関数をどの様に求めるかがポイント
- その前提に、確率分布の関数からの繋がりを理解
- ベイズの定理は、
- 条件付き確率の乗法定理が土台になっている。
- 事前確率を事後確率で更新していくことで最適化する。
- ただし、そこから、尤度、周辺尤度などの概念がどう発生しているかは難しい話。
数式 †
- 先ず、計算方法を示す数式もあるが、そうでないモノも多い。
- また、高校数学では解かないといけないが、解くものでないモノも多い。
- 多くの式は実際に計算するものではないので暗記すれば良いが(4択で計算している時間もない)、
記号の羅列を暗記するのは難いので、式の意味を理解したり、式の導出を行ったりすることで覚える。
- 数式は自然言語で数行に渡る説明を一目で示したもの。(リメディアル教育コンテンツでも方程式=説明)
プログラム実装の土台となっている数学的な理論を図示したグランド・デザイン的なモノになっている。
- 数式の意味が理解できる ≒ 設計を理解できる。
- 数式の意味が理解できる ≒ プログラムを実装できる。
式の導出 †
- 式の導出については、基本的な定理を知っていれば導出できるケースが多い。
- GPTは数式の計算過程も教えてくれるので、数式をコピペして質問すると良い。
- TeXやPPTで記述した式をコピペすれば式を理解してくれる。
- 加えて計算過程を示せと命令すれば、計算過程を教えてくれる。
全体の理解 †
- ...には数式(理論)⇔ 設計図(組立)⇔ プログラム(実装)が必要。
- ただし、それぞれの要素自体の説明には自然言語が必要になる。
- また、それぞれの要素の関連の説明にも自然言語が必要になる。
- 例えば、im2colで空間的なイメージや実装の理解が困難な場合、
(例えば高次元配列の次元の入換や計算量を減らすためのトリッキーな実装)
図表でも難しいので、自然言語の脚注で対応することになる。
- ...と言う事は、即ち自然言語の説明を読めってことだが、
- 行間なく自然言語での説明が記述されているコンテンツも少ない。
- (今の所、)数式については認定プログラムの説明は全然ダメ。
- ググって動画やブログを掘り当ててナントカ理解するような状況。
- なお、自分で解読するには以下で行うようだが難易度が高い。
(AIcia Solid Project曰く以下の試行で解読可能とのことだが)
- 特別な値を代入してみる。
- 増減を考える。
- 極限を考える。
高度なモデル †
- 得に、VAEやGANなどの生成モデルの数式は、理論の雰囲気を掴む程度。
- また、強化学習系は難しいものが多い。深層学習については、黒本に丸暗記と書かれているものも。
詳細 †
シラバスにはない。
応用数学 †
確率分布 †
パラメタ推定 †
- 自己情報量
- エントロピー ≒ 平均情報量 ≒ シャノン・エントロピー
- 交差エントロピー(クロスエントロピー)→ 対数尤度関数
- 結合エントロピー、条件付きエントロピー、相互情報量
- KLダイバージェンス(相対エントロピー、KL情報量)、JSダイバージェンス
機械学習 †
機械学習、教師あり学習、教師なし学習、半教師あり学習
(パラメタ推定)
パターン認識 †
学習上の課題点 †
検証集合 †
性能指標 †
深層学習(DNN、CNN、RNN)合わせて
全結合層、重み、バイアス
アルゴリズム
計算グラフ、合成関数の偏微分、連鎖律、勾配消失
正規化 †
=性能向上
=「汎化」性能向上
その他 †
深層学習(DNN、CNN、RNN)合わせて
im2col実装 †
深層学習(DNN、CNN、RNN)合わせて
分野別の深層学習 †
高度なモデル †
GNN †
GCN †
距離学習 †
メタ学習 †
CAM、Grad-CAM †
LIME、SHAP †
その他 †
Few / One / Zero-Shot †
- プルーニング(枝刈り)、
- 蒸留(Distillation)
- 量子化(Quantization)
参考 †
認定プログラム †
金額が安いプログラムはそれなり。
認定プログラム事業者 †
ラビットチャレンジ †
AI_STANDARD †
- 実際、受けた。
- 廉価だった。
- 実装編は良かった。
- 解説は寄せ集め感があった。
Study-AI †
- 実際、受けた。
- 高価だった。
- 実装編はあまり良くなかった。
- ベースはラビットチャレンジのHG専用コース
- ラビットチャレンジは情報が多くて良い。
- 解説は、良いものもあるが、属人的でバラツキがある感じ。
AI研究所 †
公開情報が多かったので。
... †
YouTube? †
Qiita †
E資格 †
jun40vn †
MeiyByeleth? †
(E資格対策)
深層学習 Day n系 †
zenn †
E資格 †
https://zenn.dev/search?q=E%25E8%25B3%2587%25E6%25A0%25BC
robes †
書籍 †
(ゼロから作るDeep Learning)
- 本格的な入門書
- 外部のライブラリに頼らずPythonでゼロからディープラーニングを作る
- これにより、ディープラーニングの原理を学び実装レベルで理解する。
黒本 †
徹底攻略ディープラーニングE資格エンジニア問題集 第2版 - インプレスブックス
https://book.impress.co.jp/books/1120101184
- 想定問題・模擬試験が収録。想定問題には解説が付録している。
- 想定問題で対策すれば合格できる(と言われていた、しかし、過去形かも)。
- 問題は「解説 → 問題」ではなく「問題 → 解説」のフォーマットなので、
- シラバスの体系を網羅した対策と言えるかどうか?は疑問が残る。
- (しかも、黒本改定がシラバス改定に追いついておらず古い)
- ただし、合格を目標にした場合は、本書での学習効率は良いと思われる。