4年間溜めた"光熱費のお知らせ"をディープラーニングしてみた | JupyterLab で Tensorflow (TFLearn) の LSTM を用い時系列予測してみた
前回までのあらすじ
3年間溜めた光熱費の伝票を、ひたすらExcelにまとめたのだった…
tetsuyaimagawa.hatenablog.com
今回やること
4年溜めた光熱費の伝票を、JupyterLab(データサイエンスっぽいグラフを出せるやつ)で読み込み、TFLearn(機械学習ライブラリTensorflow+α)のLSTM(再帰型ニューラルネットワーク(RNN)の一種)を用いて時系列予測を行う。
準備
光熱費をcsvにまとめる。
いるものインストール&jupyterlab起動
sudo pip install jupyterlab tensorflow numpy pandas matplotlib tflearn jupyter lab
csvをpandasで読み込んで図示。
ディープラーニング
光熱費の合計値を、前半2/3を学習、1/3をテストに振り分ける。
ユニットは6、activation関数をlinearに。optimizerはadamでlossをmean_squreに。n_epochは200で。 (※読み飛ばしてください)
実行。
学習アンド学習。
結果
オレンジが学習、緑がテスト結果。
金額は読めないけど、トレンドは掴めた…のか?
結論
ちょっとこれ、データサイエンスっぽいのではないか。
データサイエンスっぽいことをしてしまったのではないか。
そういった、
データサイエンティスト感を味わえたことに、大いに意義があったのではないだろうか。
3年溜めた"光熱費お知らせ"をデータサイエンスしてみた
背景
この世には、存在する価値が無いものが3つあります。その1つが"光熱費のお知らせ"です。
毎月こまめにチェックして金額を家計簿にまとめるなんて、専業主婦さんでもない限り大義なことです。
しかし、無意識のうちに資本が家計から流出しているのは耐え難いことです。
そこで無意識のうちにデータを集めておいて、後程分析してやろう…そう思い立ってから3年の月日が流れました。
Xデーは今日なのではないか。今日やらないならいつやるのか・・・
やったこと
というわけで、手打ちでひたすらExcelに入力していく土曜の朝(カタカタカタカタ
爽やかな休日(カタカタカタ
((((;゚Д゚))))カタカタブルブル
コンサル1年目の如きExcel作業でした。
結果
すぽん
示唆
- 1-2月が高い。
- 夏にあまりエアコン入れてないため、冬のエアコン電気代が顕著。
- 冬は風呂と床暖房によるガス代も嵩む。
- 水道は閾値があって、それ超えないかぎり大体1,900円。
- 一人暮らし男の電気代は月4,000±1,000円、ガスは1,700±800円、水道は1,900円。夏はエアコン使わないで合計6,000円くらい。冬は気を抜くと10,000円いったりする。
早く電子化されることを望む。