ノイズはどの様な計測にもつきものです。
(ノイズではなく計測装置の謎の挙動でした。メータの表示も含めてランダムに校正されている様でカットしたら合計の電力がおかしいので元に戻しました。)
会社の1月の消費電力のプロットですが、計測装置の加減で大きな外れ値があるようです。この二つの取り除くと…
それでもまだ通常の10倍程の外れ値があります。これを一年分同じ様な傾向があるのでどの様に取り除くか?
まさか手作業で取り除く?その基準は?
そこで統計処理の四分位数を使っって外れ値の削除をします。
外れ値の割合は全体の数%なので1%を四分位数で取り除くと…
1年間では
これでやっとそれらしい数値に落ち着きました。これと気温と太陽光発電量をプロットしましたが、発電量は消費電量と気温との相関関係がない様で数値が一定でグラフが見にくいので気温と消費電力をプロットしました。
それぞれ単位が違うので正規化(0−1)の値に変換してグラフにすると…
機械学習のライブラリーで四分位数で外れ値を削除しました。最初の生データで分析しても良い結果が得られません。
でもこれらの処理はそれぞれのデータで方法が変わります。
結論経験が必要。
0 件のコメント:
コメントを投稿