2019年3月18日月曜日

コンピューターの時代、インターネットの時代、AIの時代

今なぜAI(人工知能)なのか?
今までと何が違うのか?

一般の人には2000年以前はコンピューターで業務の効率を早くする事が喜ばれる時代でした。それ以前はそろばん、電卓の時代を経てコンピューターと進んで来ました。
2000年以降はインターネットの時代で色々な情報が検索出来る様になって便利でした。
もちろん並行して専門分野でコンピューターはいろいろな使われ方をしていました。

ここ数年でAI(人工知能)の時代と言われています。fuzzy(初期の人口知能)は2000年以前にありました。一般的なコンピューターの計算能力が低く限られた条件の中から判定するのですが、0か1のそれまでの判定に少し曖昧な要素を入れる事がやっとでした。
現在では計算処理スピードも早くなりや並列処理することでより同大なデータを処理出来る様になりスマートホンでも瞬間的な処理速度は一般のコンピューター並みになっています。(熱処理やバッテリーの制限があり電話としての機能が主体な為)

2012年にGeoffrey Hinton博士が人間の神経伝達の方法をコンピューターに計算させる方法が開発されて、その後グーグルがその技術を一般に広く知られる様な事に応用して知られるようになってきましたが、機械翻訳、音声認識、画像認識と呼ばれているものが俗にAIと呼ばれています。
画像認識で見た目に分かりやすく処理を可視化したもので説明します。

データの特徴を分析してその特徴とどれだけ似ているかで推測します。

この動画で黄色い線の流れが行列演算(線形代数)を行っている事になります。
それぞれの”重み”と”バイアス”を計算しています。式自体は簡単ですが、28x28ピクセルなので784回の計算をそれぞれの要素の回数する事が必要です。
上記の作業をそれぞれの手書きの”9”を数千枚処理します。その内適当な2割を教師データとして残りの8割を判定して%で答えを出します。

今は線形代数学をマンガで勉強中。
過去にも同じ様な事を書いていますが、行列演算をするといった本に書いてある事を丸暗記して書いています。今回はその考え方(線形代数)を理解しようとしています。

難解な式と単純な計算の繰り返しですが、今の最新技術の基本になります。

やっている事は9の特徴を文章ではなく式と答えで表す方法です。AIではこれを目的変数として特徴を説明変数として扱っている?
音声認識では、”あ”を目的変数、その特徴を説明変数。
他のAIを使った認識も目的変数を説明変数で行列を使って計算します。

但しAIを使わなくても古い技術を使っも出来ます。
例えば
”9”の空間座標に近いものを閾値で判別。
”あ”を音の周波数で閾値を決めて判断。
等々、古い技術は条件と精度の融通が利きません。閾値が超えないと判断も出来ません。
AIは目的変数と説明変数を選定して検証する必要があるのでフレームワークが決まっていても選定と検証に半年から1年位掛かります。

AIの導入はある程度結果を予測して想定通りな値が来たい出来るかを検証する必要がありはっきりとした結論を出すまでに可なりの時間が掛かる事を覚悟する必要があります。

既にある画像認識のモデル(学習結果)や音声認識のモデル(学習結果)を使うのであれば短時間に完成しますが、その様なケースは既にネットに方法が載っていて業務として依頼させることはありません。


0 件のコメント:

コメントを投稿