この記事では、AIについて、初心者にも分かりやすく、図解付きで丁寧に解説しています!
機械学習
- 機械学習では大量のデータからAIが学習し、パターンやルールを推測する
- 教師あり学習は機械学習の一種で、入力データとそれに対する答えをAIに与えて予測モデルを作る
- 回帰は教師あり学習の一種で、入力データから連続した値を予測する
- 分類は教師あり学習の一種で、入力データからカテゴリを予測する
- 過学習は、学習データに対しては精度が高いが、未知のデータに対しては精度が低い状態
- 交差検証は、用意したデータを複数のグループに分け、一部のグループを学習用に、残りのグループを検証用に使う、ということをグループを入れ替えながら行い、モデルの検証を行う手法
ディープラーニング
- ディープラーニングでは、人間の神経細胞に似たニューラルネットワークを取り入れて複雑な判断をする
機械学習
機械学習とは、データを分析する手法の一つで、専門家が大量のデータをシステムに入力し、大量のデータからAIが学習し、パターンやルールを推測する方法です。
機械学習の手法には「教師あり学習」「教師なし学習」「強化学習」の3つありますが、ここ最近は「教師あり学習」しか出題されていないので、教師あり学習を紹介します。
教師あり学習
教師あり学習とは、入力データとそれに対する答えを与えて学習させ、AIが入力データから答えを導けるようにする手法です。教師あり学習には更に回帰と分類の2つ種類があります。
回帰
回帰では入力データから値を予測します。回帰は連続した値が答えになるのが特徴です。
例えば、数学の点数から物理の点数を予測するのが回帰ですね。
「数学のテストが70点だったA君は物理のテストで65点でした」
「数学のテストが40点だったB君は物理のテストで41点でした」
というデータをAIに大量に与えることで数学の点数と物理の点数の関係を学習させます。
そして、「数学のテストが54点だったZ君は物理で何点取るか?」を予測させるのが回帰です。

分類
分類では入力データからカテゴリを予測します。例えば、メールがスパムか非スパムか分類したり、動物が猫か犬か人か分類するのが特徴です。要するに、Yes/Noが答えになるような学習が分類ですね。
「この画像は猫です」「この画像は人です」と言う感じで、大量の画像データを答えと共にAIに与え、AIは画像から答えのパターンを学習します。学習の時、例えば、「二足歩行していたら答えは人である」と特徴も教えてあげます。そうすることで、AIは与えられた画像データが猫か犬か人か判断出来るようになります。

過学習
AIは学習したデータから答えを予測するモデルを作ります。
しかし、そのモデルが学習データに対しては良い精度を発揮するが、未知のデータに対しての精度が良くないという状態になることがあり、これを過学習と呼びます。

AIが作ったモデルも常に完璧という訳では無いので、人間が評価してあげる必要があります。教師あり学習で使われる評価方法に交差検証があります。
交差検証
AIが作ったモデルを検証するには、学習データと検証データを用意する必要があります。

ただ検証を1回すれば、そのモデルを正しく評価出来るのかと言われると微妙な所があります。その時に使った検証データが偶々予測しやすいデータだった、みたいなことがありますからね。
そこで、交差検証では、用意したデータを複数のグループに分け、一部のグループを学習用に、残りのグループを検証用に使う、ということをグループを入れ替えながら行います。
1回目ではグループ①~④からモデルを作り、グループ⑤で検証して結果を確認します。
次に1回目で作ったモデルを一度リセットし、グループ①~③とグループ⑤からモデルを作り、グループ④で検証して結果を確認します。ということを5回繰り返し、それぞれの検証結果を平均することで、AIが作るモデルを正しく評価します。

ディープラーニング
機械学習では「二足歩行していたら人間である」のような特徴量を開発する必要がありますが、ディープラーニングでは特徴量の開発を必要としません。AIが自動で有用な特徴量を学習していきます。
ディープラーニングでは、人間の神経細胞に似たニューラルネットワークを取り入れて、複雑な判断が出来るようにしています。
基本情報技術者試験での出題例
平成31年度春期問4
基本情報技術者
午前試験 平成31年度春期問4
機械学習における教師あり学習の説明として,最も適切なものはどれか。
ア 個々の行動に対しての善しあしを得点として与えることによって,得点が最も多く得られるような方策を学習する。
イ コンピュータ利用者の挙動データを蓄積し,挙動データの出現頻度に従って次の挙動を推論する。
ウ 正解のデータを提示したり,データが誤りであることを指摘したりすることによって,未知のデータに対して正誤を得ることを助ける。
エ 正解のデータを提示せずに,統計的性質や,ある種の条件によって入力パターンを判定したり,クラスタリングしたりする。
正解は”ウ”
教師あり学習とは、入力データとそれに対する答えを与えて学習させ、AIが入力データから答えを導けるようにする手法です。
平成30年度秋期問3
基本情報技術者
午前試験 平成30年度秋期問3
AIにおける機械学習の説明として,最も適切なものはどれか。
ア 記憶したデータから特定のパターンを見つけ出すなどの,人が自然に行っている学習能力をコンピュータにもたせるための技術
イ コンピュータ,機械などを使って,生命現象や進化のプロセスを再現するための技術
ウ 特定の分野の専門知識をコンピュータに入力し,入力された知識を用いてコンピュータが推論する技術
エ 人が双方向学習を行うために,Webシステムなどの情報技術を用いて,教材や学習管理能力をコンピュータにもたせるための技術
正解は”ウ”
機械学習とは、データを分析する手法の一つで、専門家が大量のデータをシステムに入力し、大量のデータからAIが学習し、パターンやルールを推測する方法です。
平成30年度春期問3
基本情報技術者
午前試験 平成30年度春期問3
AIにおけるディープラーニングの特徴はどれか。
ア ”AならばBである”というルールを人間があらかじめ設定して,新しい知識を論理式で表現したルールに基づく推論の結果として,解を求めるものである。
イ 厳密な解でなくてもなるべく正解に近い解を得るようにする方法であり,特定分野に特化せずに,広範囲で汎用的な問題解決ができるようにするものである。
ウ 人間の脳神経回路を模倣して,認識などの知能を実現する方法であり,ニューラルネットワークを用いて,人間と同じような認識ができるようにするものである。
エ 判断ルールを作成できる医療診断などの分野に限定されるが,症状から特定の病気に絞り込むといった,確率的に高い判断ができる。
正解は”ウ”
ディープラーニングとは、人間の神経細胞に似たニューラルネットワークを取り入れて、人間のような複雑な判断が出来るようにしたものです。