機械学習とは何ぞや?アフターコロナは脱情弱!

最近のトレンドとして、
専ら「機械学習人工知能再生医療!」と叫び続けている人が目立つ。

普段何気なく聞いたことある言葉だと思うが、
ただの一市民としては神の領域の話であり、
正直言ってチンプンカンプンだろう。

だが、情報弱者が社会に取り残され、弱肉強食の世界で痛い目に遭うのは事実だ。

この記事では、そんな情弱が這い上がるための希望を少しでも与えたいと思う。

機械学習とは何ぞや?

機械学習とはなにか?」

気にはなりつつも、結局調べようとしないのが情弱の性である。

まずは小さな第一歩を踏み出してほしい。

翔泳社機械学習図鑑」では、以下のように定義されている。

機械学習
与えられた問題や課題または環境に応じて
コンピュータ自身が学習し、
学習結果を活かした問題解決や課題解決などを行う仕組み全体のこと

ほう。。。

いまいちピンと来ない。

要するに、コンピュータ上に実装された学習器の中に学習データを投入し、
学習器で分類・学習した後に将来の予測結果を出力するプロセス全般
と考えておけば良さそうだ。
(そうは言っても素人判断なので、詳細は各自でググってもらいたい。)

また、人工知能という言葉は
幅広い意味で用いられる包括的システムを意味するらしく、
下位の概念として機械学習を包含
している。

つまり、人工知能を実現するためには
機械学習だけでなく、その他のルールや数理的決定が敷かれることもあるそうだ。

機械学習は3種類!

機械学習の中には下位項目として以下3つの概念が含まれる。

  1. 教師あり学習
  2. 教師なし学習
  3. 強化学習

それぞれ、チンパン脳でも分かるようにザックリと説明したい。

教師あり学習

これは
「問題の答えをコンピュータに与えることで、機械学習モデルを学習させていくやり方」
である。

つまり、あらかじめ問題とそれに対応する答えのセット(訓練データ)をコンピュータに覚えさせていき、
その傾向とパターンを理解させるのだ。

そうすることで、未知のデータが入力されたときに
尤もらしい答えを予言(出力)することができる.

 

ここでは一例としてアイリスという花の亜種を見分ける方法を説明する.

アイリスには,Iris setosa / Iris versicolor / Iris virginicaという3種類の亜種が存在する.

f:id:Mitarai_Haruka:20200804104535j:plain

これら3種の花について,花弁とガクの長さをあらかじめ訓練データとして学習しておくことで,
未知の花(Iris setosa / Iris versicolor / Iris virginicaのいずれか)を渡されたときに
その花がどの種類であるのかを予測・判定することができる.

なお,訓練データのうち特徴を表すデータ(この場合は花弁とガクの長さ)を
特徴量説明変数と呼び,
答えとなるデータ(ここでは花の種類)を目的変数あるいはラベルと呼んでいる.

 

教師あり学習の下位概念としては
分類問題回帰問題が存在する.

簡単にいうと,以下のような説明になる.

  • 予測対象(答え)が数値 (連続値)→ 回帰問題
  • 予測対象(答え)がカテゴリ(クラス;あるいは離散値)→ 分類問題

また,分類問題のうち,
答えとなりうる選択肢が2種類のものは二値分類と呼ばれる.

一般に,答えの選択肢(クラス)が2種類よりも多く存在する分類問題を
多値分類と呼ぶ.

 

教師なし学習

続いては教師なし学習について説明しよう.

教師あり学習と異なる点は,
訓練データ(問題と解のデータセット)を用いない学習,すなわち
問題の答えである目的変数やラベルが準備されていない状況で学習することである.

別の言い方をすれば,
訓練データを使わずにデータ内のパターンを発見するのが教師なし学習の特徴である.

 

例えば,
「複数の顔写真データが与えられたとき,
ある写真のペアは目の形が似ているが口の形は似ていない」
という一例は教師なし学習の適用結果となりうる.

このように,教師なし学習を実施すると
データ内の関連性を可視化することができる.

言い換えれば,教師なし学習においては
多変数のデータを要約しており,
このようにデータを要約する手法は次元削減と呼ばれる.

 

教師なし学習には他にもクラスタリングと呼ばれる分析手法があり,
これは分類したいデータを複数あるクラスタ(似たデータの集合)のうち
いずれか1つに分類する手法である.

 

強化学習

強化学習とは,
ある環境下で行動するエージェント(個体)が
得られる報酬価値を最大化するように学習していくことである.

教師あり学習において目的変数(答え)に価値づけを行い,
その価値を最大化するための学習であるともいえよう.

 

分かりやすい例としては
ゲームでプレイヤーが高得点を獲得するために学習すること
が挙げられる.

強化学習の枠組みにはQ学習やアクター・クリティック学習など,
様々なものがある.

近年は神経科学(脳科学)や心理学の分野でも
ドーパミン報酬系と関連づけてよく用いられている概念であるため,
興味があれば勉強しておくと良いだろう.

 

以上,ここまで色々と説明してきましたが,
筆者はまだ未熟者ゆえに誤ったことを書いているかもしれません.

気づいた方のコメントをいただけると非常に助かります.