2019年3月18日月曜日

コンピューターの時代、インターネットの時代、AIの時代

今なぜAI(人工知能)なのか?
今までと何が違うのか?

一般の人には2000年以前はコンピューターで業務の効率を早くする事が喜ばれる時代でした。それ以前はそろばん、電卓の時代を経てコンピューターと進んで来ました。
2000年以降はインターネットの時代で色々な情報が検索出来る様になって便利でした。
もちろん並行して専門分野でコンピューターはいろいろな使われ方をしていました。

ここ数年でAI(人工知能)の時代と言われています。fuzzy(初期の人口知能)は2000年以前にありました。一般的なコンピューターの計算能力が低く限られた条件の中から判定するのですが、0か1のそれまでの判定に少し曖昧な要素を入れる事がやっとでした。
現在では計算処理スピードも早くなりや並列処理することでより同大なデータを処理出来る様になりスマートホンでも瞬間的な処理速度は一般のコンピューター並みになっています。(熱処理やバッテリーの制限があり電話としての機能が主体な為)

2012年にGeoffrey Hinton博士が人間の神経伝達の方法をコンピューターに計算させる方法が開発されて、その後グーグルがその技術を一般に広く知られる様な事に応用して知られるようになってきましたが、機械翻訳、音声認識、画像認識と呼ばれているものが俗にAIと呼ばれています。
画像認識で見た目に分かりやすく処理を可視化したもので説明します。

データの特徴を分析してその特徴とどれだけ似ているかで推測します。

この動画で黄色い線の流れが行列演算(線形代数)を行っている事になります。
それぞれの”重み”と”バイアス”を計算しています。式自体は簡単ですが、28x28ピクセルなので784回の計算をそれぞれの要素の回数する事が必要です。
上記の作業をそれぞれの手書きの”9”を数千枚処理します。その内適当な2割を教師データとして残りの8割を判定して%で答えを出します。

今は線形代数学をマンガで勉強中。
過去にも同じ様な事を書いていますが、行列演算をするといった本に書いてある事を丸暗記して書いています。今回はその考え方(線形代数)を理解しようとしています。

難解な式と単純な計算の繰り返しですが、今の最新技術の基本になります。

やっている事は9の特徴を文章ではなく式と答えで表す方法です。AIではこれを目的変数として特徴を説明変数として扱っている?
音声認識では、”あ”を目的変数、その特徴を説明変数。
他のAIを使った認識も目的変数を説明変数で行列を使って計算します。

但しAIを使わなくても古い技術を使っも出来ます。
例えば
”9”の空間座標に近いものを閾値で判別。
”あ”を音の周波数で閾値を決めて判断。
等々、古い技術は条件と精度の融通が利きません。閾値が超えないと判断も出来ません。
AIは目的変数と説明変数を選定して検証する必要があるのでフレームワークが決まっていても選定と検証に半年から1年位掛かります。

AIの導入はある程度結果を予測して想定通りな値が来たい出来るかを検証する必要がありはっきりとした結論を出すまでに可なりの時間が掛かる事を覚悟する必要があります。

既にある画像認識のモデル(学習結果)や音声認識のモデル(学習結果)を使うのであれば短時間に完成しますが、その様なケースは既にネットに方法が載っていて業務として依頼させることはありません。


2019年3月13日水曜日

赤外線、サーモグラフィー

元々パネルの不良の検査を安く効率的に出来そうと3年前からコツコツとしてスマホのアプリや専用基板を作っています。サポートに無理があるのでDIY出来る人に掛かった費用を払って貰って自力で製作して貰っています。
東京のMFT2017,2018展示会にも出て、メーカーの開発者ページにも載せて貰えるまでになっています。
商工会議所のコンペに落選しましたが、引き続き開発はしています。
良い縁談のお話も来そうですし。

さて本題の開発ですが現在250万円するドローンに搭載されている赤外線センサーはFLIR社のTAUと言う解像度640x320の温度計測の出来るセンサーを積んでいます。150万円するセンサーですが、既に旧型です。それに変わってBOSONと言う新しいモデルが出ていますが、温度計測に制約があります。640x320で60万円、320x240で22万円です。
今回開発にBOSON320x240を使って擬似的に640x320にチャレンジ中。
今開発したLEPTON3.5も擬似的に640x320を出力していますが、流石に同じと言うわけにはいきません。いい線行ってると思いますが…

lepton
BOSON320X240
解像度もさることながらフレームレートが1秒間60枚が良いです。
(ブログ動画を添付する為に画質を落としています。)
LEPTON3.5が4万円、BOSON320x240が22万円なので解像度が4倍で価格が5.5倍の差です。
コストパフォーマンスはあると思います。

ドローンに積んだ実験は一部の方がされていてその補助器具(ジンバル)を試行錯誤中です。もう1年以上は掛かっています。磁気ノイズの解決にフェライトコア等を使ってもダメでした。ノイズを考慮してフォトカプラを使っていますがブラシレスモーターの磁気の影響は凄まじいです。

多分個人レベルでここまで研究している人は世界でも珍しいと思います。AIも使いこなして3軸センサー使って何か作ろうとするおバカさんはいないでしょうね。
でも完成したら画期なシステムになります。挑戦は続く…

アルミ板でシールド用の箱を製作中。配線も3線のシールド線に交換。これ以上はどうしようもない。
これ上手く行けば良いのですが、、、
これが出来れば安くて軽い機構になるので結構画期的?映像がどこまで安定するかが問題ではありますが、ドローンの姿勢制御の安定性に左右されます。

2019年3月11日月曜日

先ずエラーの表示の仕方等

先ず対象のモデルと表示方法を考えます。
大きくサーモグラフィーの違いで異常の場合と正常な場合の二つ

異常ーセルやセルが繋がるクラスターの異常発熱。
   パネルを交換しないと改善しない異常。

正常ー①周辺の建物の影や雑草の影で異常発熱している
   ②パネル表面の汚れ、鳥の糞や葉っぱが表面に付いた異常発熱
   ③ジャンクションボックスの中のバイパスダイオードの発熱
*パネル自体の問題では無く外的要因による異常発熱
   

次にバウンディングボックスの表記方法。
異常は赤ーセルの異常(例)
正常は青ージャンクションボックス(例)
不明は黄色ー影や汚れの影響(例)

バウンディングボックスのコメントは分かりやすい英語で簡素
Cell Error
Junktion Box
Shadow or Dirty ? 

判定クラス増やすか減らすかは進めながら検討する。

youtubeのサーモグラフィ動画がカラーが多いですがグレースケールの方がデータ的には整理し易い様に思います。このあたりも検証が必要。時間があまりない…
サーマルカムのソフトはかなり経験を取り入れていて生データのメリットがじわじわ効いています。
特にダイナミックレンジが解析に役に立ちます。
上記の様にグレースケールではどのポイントからも比較出来ますが、
カラーパレットは温度差の激しい場合は全体として比較し難い感じがあります。
感覚的に分かるかな?
黄色の部分と青色もしくは黄色が隣り合った時はどれくらいの温度差かは慣れないと分かり辛いのわかります?
生データ(RAWデータ)があればここは自由自在で今までの努力が報われる?

ここまで赤外線を理解してメンテナンス会社は無いでしょうね?
色々な試行錯誤がここで生きてきます。
ソフトやハードをコピーして作ってもこれらのknow-howは一日の長があります。(古い言い回し!)

あとはAIで画像認識はぼちぼち進めます。ここはある程度出来ましたが実用性をよく考える必要があります。
先ずは機械学習の学習データの収集が手間暇掛かります。ここが重要です。

別案件の割り込みもあるかも?

2019年3月6日水曜日

メーカーフェア京都 2019年5月4,5日に出展します。

関西初のメーカーフェアです。アメリカ発祥で世界各国メーカーフェアがあり、近年は中国深圳でも開催される様になり一般の技術系の展示会では家電のCESが有名ですが、個人が作る技術系の展示会では世界一有名です。
W&Tを
今年も参加承認を頂きました。3回目なので展示方法も工夫して行こうと考えているのでお楽しみに。
https://makezine.jp/event/mfk2019/
昨年参加したMFT2018東京会場の模様

プラチナスポンサーは
オムロン
ゴールドスポンサーは
ソニー
オーム社
シルバースポンサー
八光電機
MACNICA
seeed
共立電子(デジット)
その他企業のスポンサーシップがあります。

子供の科学の祭典ではありますが、最新の技術を子供から大人まで分かりやすい展示を求められているので是非色々な人が子供達と一緒に参加されると良いと思います。
上場企業のエンジニアも参加するので一部結構凄い展示もあるかと思います。

商工会議所の作品の発表の機会が無かったのでここで展示します。
娘さんとご一緒に参加される事をお勧めします。

2019年3月5日火曜日

AI、ロボティックス、自動運転はベイズ統計は不可欠

一番身近なお天気予報がベイズ理論を使ったサービスになります。
確率を使っている物は殆どこの理論になります。

*ベイズ定理

データが得られた時仮定が成立している確率(事前確立と言います。)
式は簡素ですが、ベイズ統計は主観的な確率を数式に表す事で分散したデータから必要なデータを得る事が出来ます。
実はこの主幹確率は数学的にキチンと定義されていないようです。
ここ数日晴れが続いているから明日は雨って経験上考えてその通りになります。
今までの統計学では客観的な事実だけで経験上の予測に数学的な裏付けを与える事がベイズ統計になります。

テレビのクイズ番組のベイズ統計を使った有名な出題があります。
モンティー・ホール問題
A,B,Cの3つのドアがあります。
そのどれかのドアに賞金が隠されています。
確率はそれぞれ1/3になるのは理解できます。

先ず回答者が1つを選びます。 仮にAドアとします。
その後司会者が残りの2つから一つをドアを開けます。
仮にCドアを開けて賞金は隠されてないハズレでした。
残りはBドアになりますが、ここで司会者が回答者にAドアのままにするかBドアに変更するかのチャンスを与えます。
さて確率はどうなると思います?

先に答えを出すと、Bドアの確率はAドアの2倍になります。
Aドアの確率は1/3のままですが、BドアCドアの選択を司会者がする事でBドアの確率は2/3になり1/3のAドアの2倍になりました。

これは乱数を与えたプログラムで証明されています。ブログの検索でモンティーホール問題と検索すると乱数を与えたプログラムで証明した学生が多く出てきます。

このベイズ理論を使って火災保険の料率や保険会社が保険金を払いすぎて破綻する事は有りません。株式で良く使われるグラフもこれに依ります。
機械学習も自動運転もベイズ理論が無ければ成り立たないようになっています。

今一番難しいのは何を事前確率として尤度を何にして事後確率が何になるのかを理解する事です。これは慣れないとどうにもなりません。

2019年3月4日月曜日

赤外線ビジネスプラン


後藤さんに教えてもらった2017年3月時点の太陽光設備の数字。

実稼働件数合計  464,811 件   10KW以上すべて
  内数     441,485 件   50KW未満
       
         13,139  件  50KW以上500KW未満
          4,949 件 500KW以上1000KW未満
          
          4,918 件1000KW以上2000KW未満
                      320 件2000KW以上

恐らく特高クラスは250万のドローン等を使ったメンテナンスは年次点検等で使われている?
2MWクラス以上も1/3位は同じ様なサービスを実施しているとして2000件前後
高圧でそれ以外のマーケットはMAVIC 2 ENTEPRISE DUO(40万円)がシェアーを伸ばすとしても分母20000件の需要がります。つまり10倍
恐らく現在500k未満で15000件位のマーケットはドローンを使ったサービスのイニシャルコストがネックになるのでそこで今回のサービスを使うとして初年度のマーケットをどうシミュレーションするか?
メンテナンス会社が250万のドローンを使った赤外線の一回の点検サービスは20−30万/回、MAVIC 2 ENTEPRISE DUOで点検した場合は10万からと推測すると
それよりも安く5-7万円位がターゲット。センサー解像度は同じ。

10万程度のDJI個人用ドローンに5万円の赤外線機器に仮にTX2でシステムを組んでAIのサービスを提供する費用15万円のサービスで30万円がイニシャルコストで15000件のマーケットの半分を想定。
点検会社からすると6回の点検で元は取れます。仮に墜落しても被害は15万円までです。
AI機器は墜落しません。

後は初年度を弊社がおのシステムを500件受注見込みとして全体として5000万円(その内弊社の赤外線システムは2500万円)
売り上げとしては2年目行こう1000件−2000件(3年目)−2500件(4年目)として5000万ー1億ー1億2500万の売り上げになります。

それよりも200gのドローンを使った50kw未満の想定をすると凄い事になります。
MAVIC 2 ENTEPRISE DUOは1100gなので家屋の上空を飛行する事は実質無理。
だとすると45万件のマーケットが市場規模としてあります。
小型のドローンは5万円程度が安全にコントロール出来るモデルの市場価格なのでそれに5万の赤外線システム(上記と全く同じシステム)を導入したとして10倍から20倍の潜在需要として5億ー10億ー12億5000万円
ドローンに搭載せず竿(3m)に装着してさらにシェアを取れればそれ以上のセールスが見込めます。
ここまではほぼ完成しているシステム(2年も開発掛かってますが…)
基板の完成品をどこかに販売を委託するのも良いかも?
この場合はAWSのクラウドのサービスを使って一軒1万円をメンテナンス会社から頂戴すると初年度1000件として1000万円の売り上げになります。以降2000件、3000件等で良いと思います。
TX2を購入すれば15万円でメンテナンス会社が書類を発行するとメンテナンス会社の設備費としては15万で済みます。

ここからが本筋、これらの赤外線システムを使ったAIシステム(10ー30万円)をターゲットにすれば日本メンテナンス協会の知名度アップに役立つはず?
Xavier(30万円)を使わなくても5〜7クラス(ストリング落ちやセルの以上程度の)であればTX2(15万円)で赤外線画像認識は可能。
標準の形(システム構成)

基本フレームワークは今回のコンテスト様に完成しているので後は赤外線画像でパネル異常データを収集、学習でモデルを作る。

スケーラビリティ1000件の客先から注文が来てもTX2のハードを代理店から購入後バイナリーでソフトを書き込むだけ。
AWS(クラウド)を使う事が可能で実質的に世界中にサービスを提供することも技術的に可能。
もちろん太陽光以外の応用も効くシステム(害獣対策、災害救助等)

当面の課題
①パネル異常をAI画像認識して記録をとるシステムの開発(技術的に可能で難しいシステムではありませんが、今の技術者の畑違いで対応策が必要)。
②AWS(クラウド)システムも早晩必要ですが、未知の世界で1年位掛かる可能性がある。DOCKERと呼ばれるソフトで現在のNVIDIAのシステムのイメージをAWSでシミュレーションさせるだけですが、セキュリティ等に本格的なシステムエンジニアが必要。アマゾン大阪のサポートはある程度期待出来ますが。

現状のシステムを太陽光にチューニングするのに夏頃位、それまでにデータが取れれば秋頃行こうに試作は完成、第3回AIアイデアコンテストに申し込みで要件を全て満たす事とビジネスとしての目処も立つ?

2019年2月21日木曜日

はやぶさ2 と ベイズ統計学

無事目的地に到着しました。素晴らしいですね。日常の生活に関係ない様に思うかも知れませんが、これがAIに続いています。
軌道計算にアポロ計画から始まったカルマンフィルターを使って軌道計算をする統計学的手法を今も使っています。直線距離で2億8000万キロ。飛行距離52億4000万キロ、平均時速約10万キロで着陸誤差は半径3m‼︎

アポロ計画の後様々な場面で応用され、GPSデータで車の位置を予測、飛行機やドローンの姿勢制御、AIに使うデータ処理につかわれ、AIスピーカーで音声で検索や家電制等々。(余談ですが、ニールアームストロング氏今年1月19日に82歳で無くなりました。)

ベイズ統計学は日本ではここ10年程で知られる様になった統計学。
カルマンフィルターは逐次ベイズフィルタの一種でベイズの理論から来ています。

日本の今までの統計学は頻度論といって得られたデータが母集団からどの程度の頻度で発生するかを客観的に妥当か判断するものが主流。
例えば政党支持率を母集団(投票権を持つ全員)からサンプルをとって支持率〇〇%
そのサンプルを出来るだけ母集団の忠実な比率にするかを客観的に検証する。

ベイズ統計はその逆であるサンプルからある政党の支持率が〇〇%だった場合の母集団はどの様なものかを推測する。その際はどうしても主観的な検知が働いてしまう。というのは有る程度結果を推定しないと確認が取れません。それがベイズ統計の始まりです。
これがなぜAIや機械学習に役立つのか?

例を変えます。気温30度の時にアイスコーヒーの注文数を予測する。がベイズ統計
ちょっと強引な感じですが、気温が高いと冷たいものが売れるんじゃないの?って主観です。客観的ではありません。
ある年8月のお店のアイスコーヒーが平均70杯/100杯だったとします。今年の8月にコーヒーを110杯売れれば77杯になる確率が〇〇%。(回帰分析)
雨の確率、駅から10分で他のお店より広いお店の売り上げ予測等。{重回帰分析目的変数が1つ(売り上げ予測)に対して説明変数(駅からの距離とお店の広さ)が2つ以上。}
現代はこれらの想定が間違っていないかを理論や数式で確認する方法がありそれが統計学(データサイエンス)になっています。

それらを行列演算、微分等の数理式を駆使して確度をあげて行きます。
通常アナログで取得した計測装置のデータは環境によってばらつきます。
例えば太陽光発電は日射量、気温、天気によってばらつきます。それらは場所や時間等の条件を限定すれば予測出来ます。ある程度のサンプルがあればそれなりの確率になります。
風の強い地域であればそのデータも必要になるかも知れません。
黄砂や近くの山焼きが影響するかも知れません。調べたデータ(定数)から母集団のパラメーター(変数)を予測するのです。追加で分かった条件を入力すれば精度が上がります。
その条件は初めは分からない事が多いです。そこで主観的に予想や想定をして条件をどんどん追加すれば精度は上がり間違っていれば精度は下がります。

車の自動運転で先の交差点に人が立っています。横断するのでしょうかそのまま立っているのでしょうか?
計測データから先を予測するのです。閾値が超えてからでは今のサービスでは遅いのです。
予測をする事が今の新しい技術です。

推論や予測する事が最先端技術のキーワードの様です。
少し先は高い確率で、それより先は低い確率でそれぞれの%をより早くより高くあげて行く為にいろいろな技術がある様です。
その中で統計学、特にベイズ理論はスタンダードになっています。

どの技術がどのニーズに役に立つのかはやってみないと分かりません。分かりだすとみんな一斉に始めます。今までの技術はある程度コピー出来ます。これからの技術は理論や数式の理解がなくては出来ない様になっています。

AIや機械学習は概略を理解するだけでも半年掛かりました。それでもよく理解できたと思います。

今月ベイズ統計を読み終えたら少しずつ実践して行こうと思います。一読しても分からない理論や数式の連続なのでゆっくり読み解くしかない、、、根気いります。

でも今の日常には何の役にも立たない… 十分吸収出来る程若くも無い…
少しは応用出来る(出来ている?)
吸収する為に残された人生の時間はそれ程無い気もする。
悩んでいるポイントでもあります。