2019年4月21日日曜日

今しようとしている事

今密かに世界中でやろうとしている事はjetson nano($99のGPU)を使って機器側で推論する事を広げようとしています。
通常モデルを作って推論する場合最低1秒間に20回認識しないと使い物にならないと思います。と言うより実用性にならないのでJeton TX2が使われています。
これで機器だけで10万円掛かります。この金額だと普及するにはコストが掛かりすぎです。AIの部分だけで売値で20万円位になります。
Jetson nanoは安いですが、能力はTX2の2/5程度です。1秒間に10回が限界だと思います。添付の動画は1秒間に3〜5回で、こんな速さで(10回でも)は使えませんね。

コストは一気に1/3になります。ここでソフトの出番です。
講習を聞いている限りNvidiaはライブラリーをチューニングしていますが同時にある事に注目しています。以前書きましたがコンピュータービジョンやマシンビジョンを応用しようとしています。画像の特徴点を追従する機能を使います。
コンピュータービジョン(CV)やマシンビジョン(MV)とはこんな事です。
例:顔の特徴点を取得して追従(黄緑の部分)するライブラリー
Jetson nanoでは推論自体の能力を倍にする事は出来ませんがこのコンピュータービジョンを応用して推論の処理の間に最初に推論したオブジェクトをCVで追いかけて見かけ上1秒間に20回にしようとしています。理論上出来る事はわかっているのですがライブラリーに仕上げるのはメーカーの人間でもある程度時間が掛かり予定では6月末にリリースの予定ですが、それを自分たちでしよとしています。
認識率を下げずにこれが出来ると快挙です。でそれをいち早くできれば他より早く製品化が出来る事になります。

OpenCVを入れてテストしたらこんな感じです。まだまだ調整に数ヶ月は掛かる感じもあります。
見ての通り最初の処理より可也改善しています。

0 件のコメント:

コメントを投稿