視力の問題でできる事に限りがあるなかで生きていく方法を模索しています。
AIデータサイエンスといった事を始めた矢先で混乱していますが、先ずはデータです。
手元にあるデータ若しくは今後必要に応じて取得するデータがあります。
それらを活用するにはデータを前処理(異常値や欠損データを補完する)事が必要になります。それらを自動で補完する事が必要になります。
Python等のプログラムもありますが、そこまで自分でするのは現状では無理です。
pycaretというものがありました。下手な素人よりは賢いですが、ハイパーパラメータの調整で多少は変わるようです。
Matlabにその様な機能がありまた各産業の実際のデータを使った事例もあるのでそれらも自社に近いデータを見つける事が出来れば効率的になります。
問題はソフトが複雑で数学や物理法則を理解しないと扱えないので習得に時間が掛かる。1日の時間もある程度制限しないといけません。
今後のこともあるので手順や失敗を記述しながら進めて行く事が必要です。
先ずは適当なサンプルを見つける、実践する(出来なければ途中経過を記述する)。
それらを積み重ねて行く事を始めてみようと思います。
先ずはデータの前処理を勉強中です。社内のデータが欠損やカテゴリーデータの内容を正規化しないと使えないので調整しています。
少しはコードを工夫しないといけないのですが、ネットに色々と調べながら進めています。
YouTubeにも色々と勉強になる動画があるのでノートに書きながら目に負担にならない用に工夫しています。:;、()[]等が判別出来ないので疲れます。
0 件のコメント:
コメントを投稿