教師あり学習とは #
教師あり学習(Supervised Learning)は機械学習の手法の一つです. まず,学習事例として,データや基準を与えてモデルを構築します. 次に,そのモデルを使って未知のデータに対する予測を行います.
教師あり学習では,ある入力データ \(x\)に対する出力データ\(y\)がどのようになるか,いくつかの事例を正解データとして与える必要があります. このときに与えるデータを学習データ(train data)と呼びます. 次に,このデータの組み合わせ\((x, y)\)を学習することで,データの関係のモデルを構築します. そして,新しいデータ \(x\)が与えられたときに,求めたモデルを用いて,\(y\)を予測します. この新しいデータのことをテストデータ(test data)と呼びます.
教師あり学習の例 #
分類 #
\(y\)が\(x\)を分類するラベルとなっているとき,この手法は分類(classification)と呼ばれます. 分類の一例として,手書き文字認識や顔認識などが挙げられます.
手書き文字認識では,与えられた手書きの文字がどの文字にあたるのかという正しい分類(ラベル)を学習データとして与えておきます. 次にそれらの事例を学習することで,分類の規則を導出します. そして,新しい手書き文字の画像が与えられたときに,導出した分類の規則に従って,文字を分類します.
回帰 #
また,\(y\)が連続値であるとき,この手法は回帰(regression)と呼ばれます. 回帰の例として,気温\(x\)から季節商品(例えば,アイスクリーム,おでんなど)の売り上げ\(y\)を予測する問題が挙げられます.
このとき,まず観測された気温\(x\)と売り上げ\(y\)の対応を学習し,その関係をモデルとして導出します. そして,そのモデルをもとに将来の新しい気温\(x\)に対する売り上げ\(y\)を予測することになります.