僕がデータ分析者として覚醒するまで

しがない会社員がデータ分析者として覚醒するまでのブログ

2018-06-01から1ヶ月間の記事一覧

統計検定_シンプソンのパラドクス

シンプソンのパラドクス え?シンプソンズがなんだって? 「シンプソンのパラドクス」は、データの区切り方によって相関が逆になったりすることらしい。この「シンプソンのパラドクス」は、統計検定2級の問題集でも出てました。 mathtrain.jp 僕の場合、エネ…

標準化と変動係数の違い

標準化 標準化の目的は、平均と分散を考慮した上で、の数字の「大きさ」を得ることらしい。 mathwords.net 変動係数 変動係数は、異なるデータのばらつきを相対的に評価する数値らしい。 bellcurve.jp 異なるデータ同士を評価できるようにデータを変換してい…

統計検定2級_独立性の検定

独立性の検定 前回と同じ、クロス集計表をにおいて、分類されたデータ群に関連があるか検定すること。 適合度検定と同じくχ2分布を使って検定を行う。 bellcurve.jp 上記のURLから見ると、適合度検定とほぼ同じ?感じ? クロス集計表で2行あるほうが独立性の…

統計検定2級_適合度検定

適合度検定 適合度検定は、χ2分布に従う。らしい。 bellcurve.jp リンク先の例題だと、クロス集計表を使った適合度検定をしているけど、 クロス集計表の場合、自由度は(行数-1)×(列数-1)だよね? 中間の説明がないと、なぜ自由度がn-1なのか疑問だわ。。。 …

統計検定2級_ベルヌーイ試行

ベルヌーイ試行 結局のところ0/1で表せることができる試行 どの確率が欲しいかによって分布が異なる。 初めて成功するときに使う分布 幾何分布 bellcurve.jp ちょうどn回成功するときに使う分布 二項分布 bellcurve.jp 試行回数がすごく多くて、起こる確率が…