僕がデータ分析者として覚醒するまで

しがない会社員がデータ分析者として覚醒するまでのブログ

ナイーブベイズ(単純ベイズ)

ナイーブベイズ(単純ベイズ

f:id:snuow:20190508231615p:plain

概要

  • 自然言語処理によく用いられるらしい
  • 分類問題に使用
    • 確率に基づいて予測する
    • スパムの除去やカテゴリ分類に利用される

メリット

  • 自然言語処理によってそれなりに良い精度をだしてくれるらしい
  • 名詞のみで予測できるので実装も容易

デメリット

  • 日本語特有の文法や複数の単語の組み合わせには対応できていないため、予測精度が文章によっては予測精度が落ちる可能性がある。

賢くなった点

疑問点

  • BoWっていうやり方だとテキストデータが巨大になればなるほど、カラムが増えて巨大なテーブルができそうなんだけど・・・ほかにやり方があるのかしら?