2018年10月10日水曜日

機械学習の重みとバイアス

機械学習の推論結果は確率なので%になります。
画像では単に枠が示されそればレモンであるかテニスボールであるかの表示がありますが値としては%のデータを持っていて%は省略している場合が多いです。
また推論が間違っている場合があります。
この間違えが重要で学習方法が完璧ではなく改善の余地がある事を示しています。もっとたくさんの優良な学習データで長い時間学習すれば正解率は上がります。そこはデータサイエンティストの腕の見せ所です。学習データを選別して不良データを取り除いたりデータをトリミングしたり等です。
機械学習とは機械が自動的に学習する前に人間が良いデータを選別して学習させる事が重要で結構泥臭い部分がある事は案外知られていません。

さて、データはレモンの確率90%テニスボールの確率70%、その確率を決める要素は重みバイアスです。
重み(weight)は例えば黄色がよりレモンらしいとか質感等よりレモンらしいとかです。ではバイアス(bias)とは何でしょうか?先入観とか偏見といった様に重みの優先順位です。優先順位をつけて推論の確率を決めて行きます。
正方形のレモンはないので色や質感がよりレモンに近くてもレモンの確率が下がります。
球の場合はレモンの確率はそれほど下がらないかもしれません。
要素がレモンにいくら近くてもその要素の優先順位が低ければ確率は下がります。バイアスはその優先順位の様なものです。
      

ライムを学習せずにAIに推論させるとレモンとして確率を表示するでしょう。
ライムを学習させるとライムの確率を表示します。

レモン、テニスボール、ライム等はクラスといいます。AIは学習したクラスに当てはめて推論をして行きます。つまり上記3つを学習したAI の世界はレモンとテニスボールとライムしかありません。
この学習過程は以前の動画をご覧になれば機械学習がどの様に学習して重みやバイアスを決めていくかイメージ出来る思います。
ビデオで言うニューロンとは神経細胞です。



イラストや写真はネットで著作権フリーの素材を探していますが結構気を遣います。

0 件のコメント:

コメントを投稿