僕がデータ分析者として覚醒するまで

しがない会社員がデータ分析者として覚醒するまでのブログ

統計検定2級_適合度検定

適合度検定

適合度検定は、χ2分布に従う。らしい。

bellcurve.jp

リンク先の例題だと、クロス集計表を使った適合度検定をしているけど、 クロス集計表の場合、自由度は(行数-1)×(列数-1)だよね? 中間の説明がないと、なぜ自由度がn-1なのか疑問だわ。。。

χ2統計量は、理論値と実測値の差分を2乗したものを理論値で割ったものを合算したらでるらしい。 理論値を期待値で表現してる文章もどこかでみたけど、結局のところ理論値=期待値になるって理解したつもり。

実務だと、ものすごく大きいクロス集計表に対して有意を示すのに使えるのだろうか。