4年間溜めた"光熱費のお知らせ"をディープラーニングしてみた | JupyterLab で Tensorflow (TFLearn) の LSTM を用い時系列予測してみた
前回までのあらすじ
3年間溜めた光熱費の伝票を、ひたすらExcelにまとめたのだった…
tetsuyaimagawa.hatenablog.com
今回やること
4年溜めた光熱費の伝票を、JupyterLab(データサイエンスっぽいグラフを出せるやつ)で読み込み、TFLearn(機械学習ライブラリTensorflow+α)のLSTM(再帰型ニューラルネットワーク(RNN)の一種)を用いて時系列予測を行う。
準備
光熱費をcsvにまとめる。
いるものインストール&jupyterlab起動
sudo pip install jupyterlab tensorflow numpy pandas matplotlib tflearn jupyter lab
csvをpandasで読み込んで図示。
ディープラーニング
光熱費の合計値を、前半2/3を学習、1/3をテストに振り分ける。
ユニットは6、activation関数をlinearに。optimizerはadamでlossをmean_squreに。n_epochは200で。 (※読み飛ばしてください)
実行。
学習アンド学習。
結果
オレンジが学習、緑がテスト結果。
金額は読めないけど、トレンドは掴めた…のか?
結論
ちょっとこれ、データサイエンスっぽいのではないか。
データサイエンスっぽいことをしてしまったのではないか。
そういった、
データサイエンティスト感を味わえたことに、大いに意義があったのではないだろうか。