ヤマダ コウイチ   YAMADA Koichi
  山田 剛一
   所属   東京電機大学  未来科学部 情報メディア学科
   職種   講師
発表年月日 2014/03/13
発表テーマ 文書分別のための未知語からのインデックスターム生成
会議名 情報処理学会 第76回全国大会
主催者 情報処理学会
学会区分 全国学会
発表形式 口頭(一般)
開催地名 東京電機大学 東京千住キャンパス
発表者・共同発表者 大西 周, 絹川 博之, 山田 剛一
概要 文書分別のシステムを作成する際,インデックスターム作成のため形態素解析エンジンを活用することが多い.しかし,既存の形態素解析エンジンでは,ツール内辞書に存在しない単語は正しい解析を行えず未知語として出力される.従来,未知語が出現した際は,新たな単語を辞書に登録することを前提としているが,新語は次々に生まれ,辞書登録が追いつかなくなる.本研究では,汎用的な文書分別システムの制作のための,文書の形態素解析結果に含まれる未知語に対し,その未知語及び前後の形態素からインデックスタームを生成する方法を提案する.
2014
1
179 - 180
researchmap用URL http://id.nii.ac.jp/1001/00104628/