Skip to content

2022_0308_GM資料

Kato-Ryusei edited this page Dec 1, 2022 · 1 revision

今週したこと

  • 日常会話シンポジウム

    • B3 南木春希・山岡洸瑛・若林佑幸・小野順貴(東京都立大学)「『日本語日常会話コーパス』における発話の重なり分析とそれに対する音源分離の検討」

      • 書き起こしの際に、複数人による会話の重なりが問題になる
      • 二人以上が同時に発話している割合は20%ある
      • 2理以上が発話しているとき、発話が不明瞭である区間は10%、同時に話している人が多ければ聞き取りにくくなる
      • 一人の話者の音声に分離できていた
      • 従来の音源分離と異なり、CEJCは音源やマイクが移動しているで、
        • ブロック分割:距離などを細かくしている
        • 同期化:録音の時間を調整している
      • 質問:片方が笑っていると聞きたい方の声が聞こえないことがよくある、分離できるのか?コップを置いたりする音なども
        • A: 笑い声はできると考えている、人の口から同じ方向から出ているため、コップの方はもっとたくさんのマイクがあればできるかも
    • B7 居關友里子(国語研究所)「『日本語日常会話コーパス』談話行為アノテーションにみる聞き手反応」

      • 談話行為のタグを付与している
      • 相手の発話(単語)を繰り返すことの分析(繰り返しの表現と聞き手の反応のタグづけをしている)
        • 反復に対してさらに反復を返すものを分析
      • 1回目の反復は確認を求めている
      • 2回目の反復(異なる話者)1回目の確認に対して、強調の意味を込めて発話を繰り返している(「うん」「そうです」ではなく単語を繰り返していることに何か意味があるのではないか)
        • 自分の発話が受け入れられたことに対する
      • このような反応に新しいタグをつけると色々分かりそう(二つのタグ、2段階のタグを貼っている)
      • 質問:繰り返しのパターンにもさまざまなものがありそう。タグづけはされているのか
        • A色々なパターンはありそうだが、今回の分析ではそのような使い方はなかった。
      • 先行研究:中田(1992)発話の機能を分類
    • C2 千葉祐弥(NTT)・東中竜一郎 (名古屋大学)「日常会話エージェントの構築を目標とした対話状況認識と日常会話の構成要素の特定」

      • 対話状況認識をラベルから行なった
      • ラベルは 「対話形式」「対話場所」「参与者の関係」・「活動」
      • 映像、言語、音響から認識を行う、しかし、人間の評価には及ばなかった
        • 人間はより多くの情報を多くとることができているからではないか
      • 言語的に会話がどう違うのかを因子分析を行なった
      • 因子分析に機能表現の意味ラベルを使った
        • 話し言葉と書き言葉を切り分けるものはなにか(Biber,1991)
      • 「何を焼いたんですか?」から抽出できるラベルは疑問、完了、丁寧を抽出し因子分析
      • スクリープロットにより因子数を7に
        • スクリープロットとは?
      • 出てきた軸の解釈Explanationなど 会話は対話のやり方の軸と対話の目的の軸の組みあわせで表現されている
      • 因子分析の相関から対話形式と参与者の関係が対話に影響を与えていることが示唆される
    • C5 若松史恵(一橋大学大学院)・伝康晴(千葉大学) 「『日本語日常会話コーパス』の転記テキストの詳細化―相互行為研究の観点から―」

      • 母音の延伸や発話エラーなっ度に関するタグが必要
      • 言いさしの発話にハイフン「:」などをラベルを付与している
      • 相互行為研究で重要な情報を転記テキストに追加
      • 母音の引き伸ばしがある時に会話が重複した場合に、転記のずれが出た。母音の引き伸ばしの初めに重複を付与するのか子音に付与するかなど
      • 記号を付与する場所が正確でないところがあるためずれが生じた
      • 上昇音調では疑問と疑問以外の転記にずれが出た。少しだけ少しだけ音調が上昇した「の」にずれが見られた
      • 転記単位から発話単位に直すときに問題が生じる
        • 特に重複している部分
    • C6 天谷晴香(国語研究所)「マルチアクティビティにおける「行動」と「実況」の発話」

    • C7 石本祐一(国語研究所)「『日本語日常会話コーパス』にみる日常会話音声の基本周波数の多様性」

      • 会話の相手・場所・状況によって音声特徴が異なる
      • STRAIGHTを使ってFoを算出
        • STRAIGHTとはどのように使うのか?
      • CEJCはノイズや複数人が話しているので正確性には欠けている
        • そのため抽出したF0の上位下位5%を排除している
      • CEJCの方がCSJよりも2倍ほど広い分布になっている。高い声の方が広く分布している
        • さらに幅広い声を収録できている
    • E1 早野薫(日本女子大学) 「3人(以上)会話における2つ目応答」

    - E2 森大毅(宇都宮大学) 「『日本語日常会話コーパス』を対象とした話者混在音声の韻律の分析」

    • 重なった音声からFoを分離する必要がある

    • やってみると、CEJCではicレコーダーを各自がつけているので、困ることはあまりない

    • CEJCに使おうと思っていたが、真ん中に一個だけICレコーダーのみからFoを抽出するという方向にシフトした

    • 二人分のスペクトルが重ねられてしまう

    • 話者埋め込みをすることで、話者の声を入力することで推定していく

    • CEJCは収録環境がまちまちであるためあまりうまくいかなかった

    • 声の大きさが異なる、混合比がが異なる

    • 正解の声Foがないため難しい

      • 重畳していない部分のFoから推定すればうまくいくのではないか
    • 正解そのものがないから検証することができない

    • 中央のICレコーダーを対象とすれば、個人のICレコーダーの音源からのFoを正解とみなせて検証できる

    • E6 川端良子(国語研究所)「『日本語日常会話コーパス』にみる主題変更の方略」

      • 話す場面によって意味が決まる
      • 日本語の省略:聞き手にわかることは言わない
      • 話の内容、解釈が切り替わる瞬間がある
        • 省略されているものや話されている内容がガラッと変わる瞬間がある
      • 場面が変わることで、指示語が指している内容や省略された内容が切り替わる
      • 人はどのように共有しているのか
      • 場面の設定方法
        • 言語的なもの、非言語的なもの(身体動作によるもの、外界の変化によるものがある)の三つを組み合わせて場面が切り替わっていく
    • 16:30-16:55 口頭発表3 伝康晴(千葉大学)「『日本語日常会話コーパス』が拓く相互行為研究の可能性」

      • 相互行為の中で文法が果たす役割を明らかにする
      • 相互行為に関わるアノテーション
      • 研究事例
        • 相互行為の中での文法現象
          • 出現頻度としては、大人と同じ比率でフィラーが使われている
          • 子どものフィラーは
        • 日常場面の相互行為現象
          • 何か同じ活動しながら会話をしている時の方が分布がやや狭い、一定の間隔で話者交替ができている(視線が重要になっている)
          • 話者交替の時間が0秒から0.2秒の間に行われている
        • より広い意味での日常行動
          • 会話中にスマホをいじることはいつでもできるのかを分析した
          • スマホを見てからスマホを手荷物パターンと、逆のパターンでは、スマホをまず触ってからスマホを見るパターンの方が多い
    •  D3 横森大輔(京都大学)  「「はい」と「うん」:楽器レッスン場面における聞き手行動の分析」

      • カウンセラーは「はい」と「うん」どちらも使う。インタビューをする人も
        • 「うん」が優勢な時に「はい」はどのように使われるのかという研究
        • 逆はどうなのか(「はい」が優位)
      • 望ましい演奏の仕方の教示の時は「はい」。デモンストレーションやそれについての説明の時は「うん」が使われる
        • 「従う/指導」する時と「音楽について話している」時に違いがあるのではないか
    •  D4 野口芙美(東京福祉大学)   「否定応答とポライトネス」

      • 否定応答、相手の発話に対して否定する
      • 初対面対話では婉曲的な否定表現が多く見られる
      • 親しい中の会話を分析
      • オンレコード(直接的な表現)のうち6割は補償行為をおこなっている
        • 補償行為 発話をぼかすような表現「~な気がする」「フィラーを使ってぼかすなど」など
      • 補償行為がない場合は質問者のフェイスが傷付けられないと考えられる
    • 16:55-17:20 口頭発表4 丸山岳彦(専修大学・国語研究所)「『昭和話し言葉コーパス』の設計・構築と「通時音声コーパス」への展開」

      • フィラーの経年変化
      • フィラーの初出、1707年の近松門左衛門に「アノ」が見られる
      • フィラーの出現数減少している。男性よりも女性の方が減っている。昔も今も「あの」が最も多い
      • 独話、講演音声では「えー」が多い

伺いたいこと

  • julius全部一気にやったらできなかった
    • メモ:ファイル15が54秒の長さでできなかった
  • FAOMFUN09.wav 「だいがくいいんせいっていうかあの」の部分は表現形ではどのようにするか?
  • 話し言葉だったので、「手腕(てうで)」と言い直しているところを「しゅわん」と変換されていた。うまい対処法はあるのか?
  • 漢字からひらがなへの誤変換が多かった「何か(なんか)」を「なにか」と変換していた
  • juliusのズレは手で修正するしかない?
  • 音響学会見るべき発表

  • 今のところの卒研のプラン
  1. 最終目標:日常的な自然な会話の「感情」「感情の表れ」「声の微細な変化、表現」とは何かを調べたい     言葉の定義を調査、  「対話をどう分類するのかという研究」
  2. 一定の話し方・会話のスタイルから外れたものが微細な変化ではないか
  • 会話のスタイルを分類する必要がある
    • 急に前のめりな喋りな
    • 同じ家族との雑談の中でも口調が途中で変化する
  1. 日常的な会話に現れる非流暢性をスタイルの一要素とする
  • 非流暢性を調べる必要がある

  • 日常会話の「場面」「関係性」の違いが音響的特徴に与える影響に関心を持っているのだと思います。(違っていたらミーティングの時に教えてください)

  • 先生・友達・家族で話し方、声が変わる。一人の話者においてそれぞれ話のスタイル、一定の話し方が現れる。

  • 友達と話すという中にも個人ごとに話し方の違いがあるのではないか。話し方のパターン化ができるのではないか。ex普段は高い声で話し手いて、感情が現れている時低くなる。また、その逆とか


フィードバック

  • 口調が切り口の候補の一つ

  • 音声を聞いてあのテーションして口調を決め、分布を調べていく とか

  • 口調の音響的特徴の違いを見る

  • 対話場面(メタ的な情報)

    • 目的 雑談と用談、
    • 場所 家vs公共
    • 相手 親しいvs初対面
    • 状況 急いでる vs急いでいない
  • 場面が違うと非流暢性が変わる

  • 場面の違いによって変化する指標の一つ

  • まずコーパスの説明を見る

  • メタ的な情報をなぜ使わないのか ?

    • メタ的なデータは詳細ではないから(友人知人の中にも差はありそう)
  • 非流暢性はマーカーとして使えるのか?

    • 友人知人の詳細かできなかったら意味ない
  • 非流暢性も音響的特徴もマーカー,観測因子

  • 対話場面が変わるから二つも変わる

  • 非流暢性と音響的特徴を独立させないでみる、雑談対用談に

  • 「対話場面が 音響的特徴と非流暢性の関係 に与える影響」に捉えるべきではないか、こっちでなければ、対話場面を非流暢性で分類するプロセスを具体化

  • ミクロなことが一番知りたいが、ミクロなことを知るために、話し方のスタイルを知るために、マクロに比べる必要がある。そのために、非流暢性によって、対話場面を分類する必要がある。

  • 追記

    • ミクロな視点が一番関心がある、研究したいが(発話スタイルがどのようなものかを知る必要がある)、
    • そのために、マクロな視点、対話場面を分類して比較する必要がある
    • 非流暢性が重要であると考えられる理由
      • 日常的かつ自然な音声 vs 台本ありの音声 vs 書き言葉(テキスト)のみ (浅井さん)
  • 場面は軸が正しく並び替えられているか検証するかでは使える

  • 最終的に軸になれば良いから、口調をラベリング指定も良い

  • 出来上がった軸で比較解釈できないとまづい

  • しんさんの軸の選定方法を調べる

    • 比較可能な軸を作りたい
    • しんさんはどのようにまとめたかを調べれば、軸の作り方がわかる

卒研プラン 1)日常データを対象に 2)対話場面(よう定義)が:ここのプロセスをより具体化する、非流暢性が鍵と考えている 他のプランとして、場面の情報を使う、ここからここまでがこういう口調をアノテーションして進める 3)音響的特徴(よう定義) 4)に与える影響 これらを6月の1ヶ月前

  • 音響学会では、どのような音響特徴量がどのような分析に使われていたかを見ると良い

今週の課題

  • aaa
  • aaa

<- 先週 | 次週 ->

Clone this wiki locally