2022_0802_GM資料

Jump to bottom

Kato-Ryusei edited this page Dec 1, 2022 · 1 revision

今週したこと

言語特徴量のみで得た三尺度の評価
NASのフォルダに空になっているものがあり、映像が取れなかったので、音声のみで聴取
言語特徴量の明瞭さと音声の明瞭さは異なると感じた。
明瞭性が高いもの難しい
- とりあえず、自分で明瞭性が高いものと判断した音声を集めて、音響特徴量をopensmileで見て、他の音声を比較していく？
言語特徴量の親密さは音声の親密さと似ている
- 他にも音声では親密であるが、言語特徴量のみでニュートラルなものがないかを確認する必要がある?
- 同じ話者の人が発話しているものが多かった。言語特徴量のみだとその人の口調(口癖になっている語尾など)に影響される？
言語特徴量の社会階層は音声の社会階層と似ている
- 「です」「ます」「いただく」などが入っている音声が高く感じられた。言語特徴量からある程度当たりをつけられる
実験を行う上で気になった点
- 雑音が入っている区間がある
- 音声が重なっているところもある
- 短すぎると判断が難し

伺いたいこと

フィードバック

音が重なっているところを抜くと、発話が重なっているところが抜かれてしまう。
データをいくつ使えばよいか

今週の課題

言語特徴量以外のデータを確認して明瞭さが高いものと低いものの音声を選定する
ニュートラルの音声などデータの選定は難しいと思うので、音響特徴量を選ぶものを前倒しにしたい

<- 先週 | 次週 ->