「日本語テキストのトピック抽出コース」は、おもに「形態素解析」「単語の類似性から発話の特徴」「単語の連続性から発話の特徴」で構成され、自然言語処理とネットワーク分析によって、日本語テキストからトピック(話題)を抽出し、特性を把握する方法を学ぶ。
「形態素解析」では、MeCabやJanomeを用いた形態素解析や、ユーザー辞書の設定、句点濁点、大文字小文字の統一など正規表現を使った自然言語処理の前処理の方法について学習する。
※旧SEメンバーシップ会員の方は、同じ登録情報(メールアドレス&パスワード)でログインいただけます
「日本語テキストのトピック抽出コース」は、おもに「形態素解析」「単語の類似性から発話の特徴」「単語の連続性から発話の特徴」で構成され、自然言語処理とネットワーク分析によって、日本語テキストからトピック(話題)を抽出し、特性を把握する方法を学ぶ。
「形態素解析」では、MeCabやJanomeを用いた形態素解析や、ユーザー辞書の設定、句点濁点、大文字小文字の統一など正規表現を使った自然言語処理の前処理の方法について学習する。
この記事は参考になりましたか?
IT人材ラボ(アイティージンザイラボ)
IT⼈材の「採⽤・育成・活⽤・評価」に役⽴つ記事(ノウハウ、事例など)やニュース、現場の声をまとめた調査レポートなどのコンテンツを、毎日お届けしています。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です
岩佐 優子(トップスタジオ)(イワサ ユウコ)
ITや理工関係を中心に幅広い分野のコンテンツを手がける、株式会社トップスタジオに在籍。ITビギナーだった自身の経験から、「IT分野が苦手な人でも理解しやすい内容とは」を考える日々。当社が設立20周年を迎えたことを機に、新しい企画についても模索中。
※プロフィールは、執筆時点、または直近の記事の寄稿時点での内容です