ヤマダ コウイチ
YAMADA Koichi
山田 剛一 所属 東京電機大学 未来科学部 情報メディア学科 職種 講師 |
|
発表年月日 | 2015/03/18 |
発表テーマ | 文書分別のための未知語の索引化手法の評価 |
会議名 | 情報処理学会 第77回全国大会 |
主催者 | 情報処理学会 |
学会区分 | 全国学会 |
発表形式 | 口頭(一般) |
単独共同区分 | 共同 |
開催地名 | 京都大学 吉田キャンパス |
発表者・共同発表者 | 大西 周, 山田剛一, 絹川 博之 |
概要 | 文書分別のシステムを作成する際,索引作成のため形態素解析エンジンを活用することが多い.しかし,既存の形態素解析エンジンでは,ツール内辞書に存在しない単語は正しい解析を行えず未知語として出力される.従来,未知語が出現した際は,新たな単語を辞書に登録することを前提としているが,新語は次々に生まれ,辞書登録が追いつかなくなる. 本研究では,汎用的な文書分別システムの制作を最終目的とする.未知語を含む文書を形態素解析し,結果の形態素の中の未知語を索引化する手法を提案すると共に,提案手法を評価する. |
researchmap用URL | http://id.nii.ac.jp/1001/00164252/ |