AD-MARTECH LABO

アドテク・マーテクを中心に、最新技術を片っ端から総ナメして、分かった気になるブログ

4年間溜めた"光熱費のお知らせ"をディープラーニングしてみた | JupyterLab で Tensorflow (TFLearn) の LSTM を用い時系列予測してみた

前回までのあらすじ

3年間溜めた光熱費の伝票を、ひたすらExcelにまとめたのだった…
tetsuyaimagawa.hatenablog.com

今回やること

4年溜めた光熱費の伝票を、JupyterLab(データサイエンスっぽいグラフを出せるやつ)で読み込み、TFLearn(機械学習ライブラリTensorflow+α)のLSTM(再帰ニューラルネットワーク(RNN)の一種)を用いて時系列予測を行う。

blog.jupyter.org

tflearn.org

Understanding LSTM Networks -- colah's blog

準備

光熱費をcsvにまとめる。
f:id:tetsuyaimagawa:20170524150237p:plain


いるものインストール&jupyterlab起動

sudo pip install jupyterlab tensorflow numpy pandas matplotlib tflearn
jupyter lab


csvをpandasで読み込んで図示。
f:id:tetsuyaimagawa:20170524150049p:plain


ディープラーニング

光熱費の合計値を、前半2/3を学習、1/3をテストに振り分ける。
ユニットは6、activation関数をlinearに。optimizerはadamでlossをmean_squreに。n_epochは200で。 (※読み飛ばしてください)

実行。

f:id:tetsuyaimagawa:20170524152421p:plain

学習アンド学習。

結果

f:id:tetsuyaimagawa:20170524152457p:plain

オレンジが学習、緑がテスト結果。
金額は読めないけど、トレンドは掴めた…のか?

結論

ちょっとこれ、データサイエンスっぽいのではないか。
データサイエンスっぽいことをしてしまったのではないか。

そういった、

データサイエンティスト感を味わえたことに、大いに意義があったのではないだろうか。