聞きやすいアナウンス音声をめざして【Part 1】

静かなところで発せられる音声と、周りがガヤガヤしている中で発せられる音声ではその音響的な特徴に差が生じることが知られています。この現象は、それを報告した研究者の名前が付けられ「Lombard効果」と呼ばれています。雑音下で発せられたいわゆる「Lombard音声」のほうが、やはり雑音下で聴取した際に聞き取りやすいことも多くの研究によって報告されています。

例えば、次のようなフレーズを静かな環境とバブルノイズ(複数の人が話すガヤガヤとした雑音)の雑音環境とで読んでもらった音声をご紹介します。

「続いて天気予報です。関東地方では午前中、雨の残るところがありますが、日中は概ね晴れるでしょう。日中の気温は、この時期としては温かく、15度前後まで上がるでしょう。」

これらの音声に対して音響分析を施した結果、以下のことがわかりました。

  1. 雑音下のほうが発話の音圧レベルが上昇する。なお、この例では録音レベルを調節しているため、その違いは相殺されています。
  2. 雑音下のほうが発話された音声の基本周波数が上昇する。
  3. 雑音下のほうが広母音の第1フォルマント周波数が上昇する。
speech_quiet.wav
speech_noise.wav

この例は、学生リポーターとしても活躍されている平井美優さんにご協力いただきました(録音は2018年11月)。アナウンサーとして雑音のあり・なしに関わらず常に同じ発話を心がけている平井さんの音声は、聞いた感じあまり差が感じられません。その点、さすが!という印象です。ところで、その音声について音響分析を施してみると、細かい点で次のことがわかりました。上記の2)については基本周波数が22 Hz程度上昇していました。さらに、上記の3)についても母音「ア」では第1フォルマント周波数が34 Hz程度上昇していることがわかりました。第1フォルマントは口の開き方に関係していることが知られているため、雑音環境下ではより声を張り上げ、口を大きく開けていることがわかります。同様に、母音「エ」「オ」では第1フォルマントが40 Hz程度上昇していました。狭母音である「イ」と「ウ」では異なる結果が得られました。「ウ」では100 Hz程度上昇していた一方、「イ」では80 Hz程度、逆に下がっていました。「イ」に限っては、「狭い母音はより狭く」という意識が働いていたのかもしれません。

ご協力いただきました平井美優さん、どうもありがとうございました。
  1. E. Lombard, “Le signe de l’elevation de la voix,” Ann. Mal. de l’Oreille et du Larynx, 37, 101-119, 1911.
  2. W. Van Summers, D. B. Pisoni, R. H. Bernacki, R. I. Pedlow and M. A. Stokes, “Effects of noise on speech production: Acoustic and perceptual analysis,” J. Acoust. Soc. Am., 84, 917-928, 1988.