ムカワ ナオキ   MUKAWA Naoki
  武川 直樹
   所属   東京電機大学  システムデザイン工学部(2017年度新設) デザイン工学科(2017年度新設)
   東京電機大学  情報環境学部 情報環境学科
   東京電機大学大学院  情報環境学研究科 情報環境学専攻
   東京電機大学大学院  先端科学技術研究科 情報通信メディア工学専攻
   職種   教授
言語種別 日本語
発行・発表の年月 2019/02
形態種別 学術研究論文
査読 査読有り
標題 話速変換を利用する会話における映像同期手法とその効果
執筆形態 共著
掲載誌名 電子情報通信学会論文誌 A
掲載区分国内
出版社・発行元 電子情報通信学会
巻・号・頁 102-A(2),59-57頁
総ページ数 9
著者・共著者 斎藤 博人 小山内 一樹 徳永 弘子 武川 直樹
概要 話速変換(SRC: speech rate conversion)とは,音声の高さを保ったまま速度を変える技術であり,聞き取りを支援する聴取補助技術の一つとして利用されている.本研究は,ゆっくりとした発話に変換された音声を聴取するユーザに対して,映像も音声と同期する,ゆっくりとした映像に加工し,リップシンクが取れる会話インタフェースの設計とその評価をする.会話実験では,話速変換によりゆっくりになった音声に映像を同期する3人会話の会話システムを構築し,映像同期・非同期の条件間で,話し手に宛先指定された聞き手の反応潜時(聞き手が,話し手の発話の終了時点を聴取してから,次話者として発話を開始するまでの時間)を計測し比較をした.その結果,映像同期の条件の方が非同期条件よりも反応潜時が短くなり,映像と音声を同期してゆっくりと再生する聴取環境が,ユーザの次発話のしやすさに寄与することを示す.