2019-05-08 ナイーブベイズ(単純ベイズ) Python 予測 勉強 自然言語処理 ナイーブベイズ(単純ベイズ) 概要 自然言語処理によく用いられるらしい 分類問題に使用 確率に基づいて予測する スパムの除去やカテゴリ分類に利用される メリット 自然言語処理によってそれなりに良い精度をだしてくれるらしい 名詞のみで予測できるので実装も容易 デメリット 日本語特有の文法や複数の単語の組み合わせには対応できていないため、予測精度が文章によっては予測精度が落ちる可能性がある。 賢くなった点 こういった分類問題に使用する場合、Mecabやjanomeで分かち書きしても、データの前処理が必要 疑問点 BoWっていうやり方だとテキストデータが巨大になればなるほど、カラムが増えて巨大なテーブルができそうなんだけど・・・ほかにやり方があるのかしら?