僕がデータ分析者として覚醒するまで

しがない会社員がデータ分析者として覚醒するまでのブログ

エネルギーデータを4年分析してわかったこと

概要

 私は建築物の消費エネルギーのデータ分析(省エネ分析)を4年行ってきました。
大学・病院・事務所ビルなど 様々な建物のエネルギーデータの分析をさせていただきました。
4年分析してきてわかったことを書きます。

  1. お客様はそれほど分析内容に興味がない(結果には興味がある)
  2. お客様はデータがあればデータ分析は簡単にできると思っている(簡単ではない)
  3. データ分析は楽しい(楽しい!!)

1. お客様はそれほど分析内容に興味がない

cost_cut_sakugen_samurai.png

  • 建物のオーナーサイドは、ほぼ分析内容に興味はありません。(90%ぐらいのオーナーは興味を示しませんでした。)
    当然といえば当然ですが、お金に換算できるものには興味を示されます。オーナーサイドとしては当然かと思います。
    ただ、ご依頼のあった報告書(両面100ページ程度)を全くご覧にならずに、別途ただ働き作成させていただいたA3用紙1枚のコスト削減量しか記載していないグラフのみで打ち合わせをされたときは絶句しました。

  • 逆に建物の管理を委託されている方々は、分析内容に比較的興味を持たれているようでした。
    当然といえば当然ですが、委託された側からすると余計な業務(データ提供など)が増えるので、 最初はものすごーくめんどくさそうにされることも多々あります。

2. お客様はデータがあればデータ分析は簡単にできると思っている

business_marunage.png

  • 過去1年分のデータあるし、データ分析なんて簡単だよね?(簡単ではない)
    建築業界のエネルギーデータをご覧になったことはあるでしょうか?
    現場とデータ分析の部署が分かれていることが多く、現場サイドでデータのカラム名や最終的なデータの精度を決めてることが多いのです。
    時系列データなのでindexはタイムスタンプにはなっており、基本的にindexは問題ありません。(1sec~1yearまで様々) 

問題は、
1. カラム名が重複している。
2. 重複しているのに全く違うデータが入っている。
3. 指示したカラム名が存在しない。。。etc

言い始めたらきりがない、これはひどい
「データが正しい状態で保存されている≠データが存在している」と理解している人が社外だけでなく社内ですら少ない。
この業界だけですか?ほかの業界はもっと違うんですかね?

3. データ分析は楽しい  

データの前処理は泥臭くて、課題解決できなけりゃ文句を言われて、社内外に敵が多いデータ分析の楽しい要素
business_man_macho.png

  1. 課題解決のプロセスは、オープンワールド謎解きゲームをしてる感じで楽しい!
    • 解決に至るプロセスが複数ある!(マルチエンディングだけど、すべてバッドエンドの場合もあるぞ!)
    • ダミーの手掛かりがあったり、なかったり!(ダミーを選択しないようにしよう!)
    • 仲間と協力することで解決がスムーズにいく場合が多いぞ!(ソロプレイはリアルオンラインゲームでは不利だ!)
    • クリアの証は、ニーズのあるところにもっていかないとだめだぞ!(依頼者がクリアの証を欲しがってるとは限らないぞ!)
  2. データ分析は、料理のようでたのしい!
    • 下ごしらえが大事(データの前処理、精度の担保)
    • 工程が大事(セオリーがあるなら、先にセオリーを)
    • 盛り付けも大事(いい結果を出せても可視化してわかりにくければ×)
    • コンビニ弁当が好きな人に高級料理を出してもダメ(ニーズにあったものを提供しないと理解してもらえない)

おわりに

つらいこともあるけど楽しいこともあるデータ分析。
今後もデータ分析していきたいなと考えている今日この頃。
ビッグデータに疎い建築業界の僕にこの先生き残る道は残されているのか!
ライフはまだ残ってる。ここを耐えれば、この荒波に勝てるんだから!
次回!@snuow死す!デュエルスタンバイ!