最先端技術即席実装(SSJ)

最先端技術即席実装(SSJ)

いかに時間をかけないで、最新技術を使いこなすかを目標にした活動記録

4年間溜めた"光熱費のお知らせ"をディープラーニングしてみた | JupyterLab で Tensorflow (TFLearn) の LSTM を用い時系列予測してみた

前回までのあらすじ

3年間溜めた光熱費の伝票を、ひたすらExcelにまとめたのだった…
tetsuyaimagawa.hatenablog.com

今回やること

4年溜めた光熱費の伝票を、JupyterLab(データサイエンスっぽいグラフを出せるやつ)で読み込み、TFLearn(機械学習ライブラリTensorflow+α)のLSTM(再帰ニューラルネットワーク(RNN)の一種)を用いて時系列予測を行う。

blog.jupyter.org

tflearn.org

Understanding LSTM Networks -- colah's blog

準備

光熱費をcsvにまとめる。
f:id:tetsuyaimagawa:20170524150237p:plain


いるものインストール&jupyterlab起動

sudo pip install jupyterlab tensorflow numpy pandas matplotlib tflearn
jupyter lab


csvをpandasで読み込んで図示。
f:id:tetsuyaimagawa:20170524150049p:plain


ディープラーニング

光熱費の合計値を、前半2/3を学習、1/3をテストに振り分ける。
ユニットは6、activation関数をlinearに。optimizerはadamでlossをmean_squreに。n_epochは200で。 (※読み飛ばしてください)

実行。

f:id:tetsuyaimagawa:20170524152421p:plain

学習アンド学習。

結果

f:id:tetsuyaimagawa:20170524152457p:plain

オレンジが学習、緑がテスト結果。
金額は読めないけど、トレンドは掴めた…のか?

結論

ちょっとこれ、データサイエンスっぽいのではないか。
データサイエンスっぽいことをしてしまったのではないか。

そういった、

データサイエンティスト感を味わえたことに、大いに意義があったのではないだろうか。

3年溜めた"光熱費お知らせ"をデータサイエンスしてみた

f:id:tetsuyaimagawa:20170524143223j:plain

 

背景

この世には、存在する価値が無いものが3つあります。その1つが"光熱費のお知らせ"です。

 

毎月こまめにチェックして金額を家計簿にまとめるなんて、専業主婦さんでもない限り大義なことです。

しかし、無意識のうちに資本が家計から流出しているのは耐え難いことです。

 

そこで無意識のうちにデータを集めておいて、後程分析してやろう…そう思い立ってから3年の月日が流れました。

 

Xデーは今日なのではないか。今日やらないならいつやるのか・・・

 

 

 

やったこと

というわけで、手打ちでひたすらExcelに入力していく土曜の朝(カタカタカタカタ

 

 

爽やかな休日(カタカタカタ

 

 

 

((((;゚Д゚))))カタカタブルブル

 

 

 

コンサル1年目の如きExcel作業でした。

 

 

 

 

結果

すぽん

 

 

示唆

  • 1-2月が高い。
  • 夏にあまりエアコン入れてないため、冬のエアコン電気代が顕著。
  • 冬は風呂と床暖房によるガス代も嵩む。
  • 水道は閾値があって、それ超えないかぎり大体1,900円。
  • 一人暮らし男の電気代は月4,000±1,000円、ガスは1,700±800円、水道は1,900円。夏はエアコン使わないで合計6,000円くらい。冬は気を抜くと10,000円いったりする。

 

早く電子化されることを望む。