2019年4月30日火曜日

いよいよAIの作業

社長からお題を頂戴したので作業に入ります。

今までデタラメなブログでの説明?で必要な要件を説明したり何が重要なのかを書いて来ましたが、実際自分で実践的な作業はした事がなく誰かのコピペでした。
何度か試みましたが、作業が簡単ではないので改めて説明します。

何をAIで判断したい(目的変数)のかを決めるところからですが、これはとりあえず決まるのですがこれを導き出すデータ(説明変数)を何かも合わせて考えます。

7月10日までに結果を出すのは難しいと思っています。昨年10月から始めようとしていましたが説明変数が決まってもそのデータを4000から5000は取らないと答えを導き出す事は不可能です。
定期等なデータを使えば過学習で目的変数を導き出せません。

フレームワークとハードウェア(NVIDIA Jetson)は決まりました。
これは線形代数(行列計算)の専用機能があるのでデータを集める事が出来れば一気にケリがつきます。

3ヶ月それに掛かりきににならないと出来ない事はわかっています。
素人が片手間で出来る事ではありません。
先日の講習でAIはデータで決まりますとの事。それも質の良いデータでないといけません。そのデータ集めて3ヶ月は掛かります。
質の良いデータとは=目的変数を導き出せるデータです。
例えば、新規出店をするために(目的変数)駅に近い立地や人通りのデータ(説明変数)は良いですが、店長の帽子のデザイン(これも説明変数)では質の良いデータとは言えません。

恐ろしいのは作業をある程度進めてデータを撮り始めて良い目的変数が出なければ全て一からやり直しです。
どこまでそれを許される環境になるかが問題になると思います。
今回は画像認識のAIなので4000種類の写真に一つ一つ目的の画像を座標で囲ってそれにラベルをつけて行く作業をします。間違えると一からやり直しです。
この作業が済めばフレームワークに従って学習させます。7−8時間GPUに作業させます。
訓練精度と予測精度が共に良いような、そんなエポック数(学習回数)を見つけること。
ご覧んの様に片手間で出来ない…

0 件のコメント:

コメントを投稿