ようこそ ゲスト さん
ログイン
入力補助
English
カテゴリ
インデックスツリー
ランキング
アクセスランキング
ダウンロードランキング
その他
法政大学
法政大学図書館
インデックスツリー
資料タイプ別
学位論文
修士論文
スポーツ健康学研究科
国際文化研究科
情報科学研究科
理工学研究科
理工学研究科生命機能学専攻
工学研究科
政策科学研究科 (旧)
このアイテムのアクセス数:
65
件
(
2025-03-24
06:33 集計
)
Permalink : https://hdl.handle.net/10114/6886
閲覧可能ファイル
ファイル
フォーマット
サイズ
閲覧回数
説明
中村亮太
pdf
4.91 MB
84
論文情報
ファイル出力
アイテムタイプ
学位論文
タイトル
発話時の顔画像を用いた発声単語認識システムの構築
著者
著者名
中村, 亮太
著者名
NAKAMURA, Ryota
言語
jpn
発行年
2011-03-24
著者版フラグ
Not Applicable (or Unknown)
学位授与年月日
2011-03-24
学位名
修士(工学)
学位授与機関
機関名
法政大学 (Hosei University)
キーワード
発声単語
読唇
オプティカルフロー
部分空間
spoken words
lip-reading
optical flow
subspace method
内容記述
工学研究科システム工学専攻; 指導教授: 赤松茂
抄録
本論文では,発話時の顔の動画像から抽出される口周辺の動きの情報を用いることによって,音情報によらずに発声単語の自動識別を行うシステムについて述べる.時系列画像の各画素における動きをOptical Flow の算出によって求めた.それぞれの発話単語の発話の開始と終わりの位置を決定し,発話区間を抽出し,発話ピークフレームをその区間の中から取得する.また,部分空間法を用いて,辞書の作成を行い,類似度を計算することで識別を行った.発話単語認識に関する基本的な性能評価として,「ありがとう」「こんにちは」を含む発話7単語の識別実験を行った.
This paper describes a vision-based spoken word recognition system that utilizes, instead of audio signal, visual motion signal which is obtained from motion pictures during speech. Motion information on each pixel in the input time-series imagery was obtained by computation of optical flow. The utterance interval was extracted by defining both starting and ending points of time for each spoken word, and some peek frames in the utterance interval were obtained. Subspace method (CLAFIC: CLAss-Featuring Information Compression method) was applied to register in the classification dictionary and to classify each spoken words. As a preliminary performance evaluation of the proposed feature in spoken word recognition, discrimination test of seven spoken words including A-RI-GA-TO-U and KO-N-NI-CHI-WA was conducted.
資源タイプ
Thesis
インデックス
資料タイプ別
 > 
学位論文
 > 
修士論文
 > 
工学研究科
114 工学部 (旧) ・工学研究科
 > 
学位論文
 > 
修士論文
ホームへ戻る