Skip to content

2022_0802_GM資料

Kato-Ryusei edited this page Dec 1, 2022 · 1 revision

今週したこと

  • 言語特徴量のみで得た三尺度の評価

  • NASのフォルダに空になっているものがあり、映像が取れなかったので、音声のみで聴取

  • 言語特徴量の明瞭さと音声の明瞭さは異なると感じた。

  • 明瞭性が高いもの難しい

    • とりあえず、自分で明瞭性が高いものと判断した音声を集めて、音響特徴量をopensmileで見て、他の音声を比較していく?
  • 言語特徴量の親密さは音声の親密さと似ている

    • 他にも音声では親密であるが、言語特徴量のみでニュートラルなものがないかを確認する必要がある?
    • 同じ話者の人が発話しているものが多かった。言語特徴量のみだとその人の口調(口癖になっている語尾など)に影響される?
  • 言語特徴量の社会階層は音声の社会階層と似ている

    • 「です」「ます」「いただく」などが入っている音声が高く感じられた。言語特徴量からある程度当たりをつけられる
  • 実験を行う上で気になった点

    • 雑音が入っている区間がある
    • 音声が重なっているところもある
    • 短すぎると判断が難し

伺いたいこと

フィードバック

  • 音が重なっているところを抜くと、発話が重なっているところが抜かれてしまう。
  • データをいくつ使えばよいか

今週の課題

  • 言語特徴量以外のデータを確認して明瞭さが高いものと低いものの音声を選定する
  • ニュートラルの音声などデータの選定は難しいと思うので、音響特徴量を選ぶものを前倒しにしたい

<- 先週 | 次週 ->

Clone this wiki locally