以下の記事でAIについて紹介しました。現在のAIは機械学習と呼ばれる技術に支えられています。
この記事では機械学習について紹介していきます。
機械学習の概要
機械学習(Machine Learning)は、機械(コンピュータ)が学習することです。そのままですね。
もう少し専門的な言い方をすると、データからパターンやルールを学習し、新たなパターンを発見したり、その結果を利用して将来を予測する手法のことが機械学習です。
機械学習の多くは、確率や行列演算などの数学的アプローチを用いて実現されています。
機械学習でできること
機械学習でできることが大きく分けて2つあります。
1つ目は仲間分けをすることです。分類、識別とも言います。
あらかじめ何を持って類似しているかを定義する必要がありますが、その定義に従って、どれとどれが近い関係にあるかを分類することができます。
2つ目は未知の情報を予測することです。回帰と呼ばれることもあります。
例えば、過去の傾向を学習して将来の数値を予測したり、学習したことのないデータが与えられたら、過去のパターンからそれに近いものを予測することができます。
機械学習のアルゴリズム
機械学習のアルゴリズムとは、分類や予測を行うための手順を形にしたものです。
機械学習のアルゴリズムは様々な種類がありますが、次の大きく分けると次の3種類になります。
- 教師あり学習(Supervised Learning)
- 教師なし学習(Unsupervised Learning)
- 強化学習(Reinforcement Learning)
教師あり学習(Supervised Learning)
「教師あり学習」とは「入力データ」と「正解データ」がセットになった訓練データです。コンピュータに対して大量の「入力データ」と「正解データ」を与えることでコンピュータが入力データの特徴を読み取り、正解データを学習します。これらを学習することで未知のデータを判断することができるようになります。
教師なし学習(Unsupervised Learning)
「教師なし学習」とは教師あり学習と異なり「正解データ」が与えられていません。与えられたデータから規則性を発見し学習する手法です。
強化学習(Reinforcement Learning)
強化学習とは、試行錯誤を通じて「価値を最大化するような行動」を学習する手法です。
教師あり学習と似ていると言われますが、与えられた正解の出力をそのまま学習すれば良いわけではなく、もっと広い意味での「価値」を最大化する行動を学習しなければなりません。
機械学習と統計学
機械学習の話をすると出てくるのが統計学の話です。機械学習と統計学はほぼ同じものだと思って差し支えありません。
強いて違いを挙げるのであれば、データ分析の考え方に違いがあります。
機械学習は予測重視です。未知への予測精度を追求している傾向にあり、機会が立てた仮設に従いデータ分析を行っている。
統計学は説明重視です。データの性質の理解や説明を追求している傾向にあり、人間が立てた仮設を検証することが目的となっている。
機械学習の中身はブラックボックスとなっていて人間に理解できないようになっている。一方で統計学では人間が理解しやすい形式で分析結果を示してくれるという違いがあります。
機械学習と深層学習
深層学習(Deep Learning)も機械学習の話をすると出てくるワードです。
Deep Learningは機械学習の代表的な手法の1つで、Neural Network
の発展形です。
Neural Networkは人間の神経回路を模倣した手法で、層のような構造となっている。この層が増えれば増えるほど、たくさんのパターンが学習できるようになり、精度が高くなります。
昔はこの層が2〜3層ほどで、技術的にもコンピュータのスペック的にも限界がありました。しかし、近年のハードウェアの進化と手法の改良により、1000層を超えるものが実現可能となりました。この層が深いことからDeepLearningと呼ばれるのです。
深層学習の特徴
学習データ加工、特徴量加工が最小限でよく、代わりにどのような構造でNeural Networkを設計するのかによって飛躍的に精度が上がる手法です。
特徴量は多くの仮説とノウハウに基づく必要性があるのですが、それに比べて構造の検討は実現したい概念からアプローチが可能となりました。
とはいっても、現時点で深層学習はたくさんのノウハウを必要とします。分析者の高度な知識とスキルが必要になります。
AIはどうやって実現?
今までの話をまとめると、AIは機械学習と言う手法に支えられています。機械学習は深層学習という更に高度な手法の出現により支えられています。これらの手法の出現により、現在のAIブームが支えられています。