-
Notifications
You must be signed in to change notification settings - Fork 0
2022_0802_GM資料
Kato-Ryusei edited this page Dec 1, 2022
·
1 revision
-
言語特徴量のみで得た三尺度の評価
-
NASのフォルダに空になっているものがあり、映像が取れなかったので、音声のみで聴取
-
言語特徴量の明瞭さと音声の明瞭さは異なると感じた。
-
明瞭性が高いもの難しい
- とりあえず、自分で明瞭性が高いものと判断した音声を集めて、音響特徴量をopensmileで見て、他の音声を比較していく?
-
言語特徴量の親密さは音声の親密さと似ている
- 他にも音声では親密であるが、言語特徴量のみでニュートラルなものがないかを確認する必要がある?
- 同じ話者の人が発話しているものが多かった。言語特徴量のみだとその人の口調(口癖になっている語尾など)に影響される?
-
言語特徴量の社会階層は音声の社会階層と似ている
- 「です」「ます」「いただく」などが入っている音声が高く感じられた。言語特徴量からある程度当たりをつけられる
-
実験を行う上で気になった点
- 雑音が入っている区間がある
- 音声が重なっているところもある
- 短すぎると判断が難し
- 音が重なっているところを抜くと、発話が重なっているところが抜かれてしまう。
- データをいくつ使えばよいか
- 言語特徴量以外のデータを確認して明瞭さが高いものと低いものの音声を選定する
- ニュートラルの音声などデータの選定は難しいと思うので、音響特徴量を選ぶものを前倒しにしたい