僕がデータ分析者として覚醒するまで

しがない会社員がデータ分析者として覚醒するまでのブログ

統計学のお勉強_003

点推定と区間推定

  • 点推定は、標本集団を使って1点を推定する方法
  • 区間推定は、標本集団を使って区間を推定する方法

実務上、点推定ってどういうときに使えるんだろうか? エネルギーの分析を行っている身としては、区間推定を使って、年間通して信頼区間95%でこの間に電力量が収まります。っていう提案のほうが使える気がする。

  • 統計の勉強をするときに下記のページがよく引っかかるんだけど、本当にお世話になっております。

mathtrain.jp

そうか、区間推定は、点推定の拡張?バージョンでっていう認識でいいのか。
区間推定はエネルギー分析で使えそうって思ったけど、2σの範囲ってエネルギー分析行う上での信頼区間として妥当なんだろうか。
このあたりの考察ももっと統計学をしればわかっていくんだろうか。

データ分析者として覚醒するのはまだまだ先だな。急がねば

Pythonのお勉強_言語処理100本ノック_更新[5]

enumerate,zip

第5問はenumerate,zipが活躍した。若干カンニングしてしまった。。。 Pythonでループ処理するのはすごく便利だなぁ。

github.com

string = "Hello world!"
for elm in enumerate(string):
    print(elm[0],elm[1])

#output
0 H
1 e
2 l
3 l
4 o
5  
6 w
7 o
8 r
9 l
10 d
11 !

何番目の文字かをiとか適当な変数置かなくていいのがうれしい。 もっといい方法あるんだろうなぁ。可読性の高くスマートなコードが書きたひ。

Pythonのお勉強_言語処理100本ノック_更新[3-5]

言語処理100本ノック

 今回3問やってみて思ったことは、便利な関数がPythonには備わっていて、簡単にやりたいことが実装できる手軽さはすごくありがたい。 これは大学で学んだCやJavaにはないことで、今の業務のデータ分析にはすごくマッチしているからやりがいもある。

github.com

データ分析を生業として生きてきたいわぁ

統計学のお勉強_002

標準正規分布

複数のデータが分布があり、それぞれ母集団が異なる場合単純に比較できない。そのため、それぞれの変化量に対して標準化を行い、標準変化量として比較する。

標準変化量

bellcurve.jp

ポアソン分布

ポアソン分布は、試行回数が多く、起こる確率が非常に少ない試行における2項分布のことです。 e.g.) 工場で製品の生産における、故障率を算出する場合に使用する?

bellcurve.jp

ここまで、やっておいてなんだけど、実務上でこの分布はどうやって生かすのだろうか?

Pythonのお勉強_言語処理100本ノック

言語処理100本ノック始めました。

今日から言語処理100本ノック始めました。
githubでソースは管理していこうと思います。

経緯

今まで、個人で業務効率化やデータ分析のために独学でPythonを使ってきました。業務でプロのプログラマーソースコードを見ることがあり、あまりのきれいさに自分のコードを見るのが恥ずかしくなりました。
きれいなコードを書くことが目標ではありませんが、メンテナンス性のよいツールの開発や技術の幅を広げることを目標として頑張っていきたいと思います。

今日はここまでやりました。

github.com

統計学のお勉強_001

標本統計量の分布

  • 標本誤差
    標本分布の標準偏差のこと
  • 正規分布
    標本サイズがものすごく大きい標本平均の分布?
    標本サイズがものすごく大きい標本平均は正規分布に従う

  • t分布、z分布
    まだ理解してないのでまた明日。

今日は少なかったなぁ

統計学のお勉強_000

統計学のお勉強

本日より、統計学の勉強の備忘録をつけていこうと思います。

今日の勉強内容

  • 不偏推定量
     偏りの大きい標本統計量から自由度を使って求める推定量(偏りの少ない)のこと

  • 自由度
     A+B+C = xとした場合、自由度は3(左辺の個数)
     A+B+C = 5 とした場合、自由度は2
     ↑は右辺が決定したことにより、AとBを特定の値にした場合、Cを選択できなくなるため  e.g. 2+1+C =5 の場合、Cは任意の数字にはできず2と確定してしまう。その場合、自由に選択できる変数はAとBの2変数となるため、自由度は2となる。

まとめるのって大変だ!
頑張って継続しよう