聞きやすいアナウンス音声をめざして【Part 3】

2020年に世界保健機関(WHO)がパンデミックを宣言してから一層、COVID-19の猛威が世界各国で深刻化しました。そのような中、マスクをすることの重要性が改めて認識されてきたわけですが、マスクによる音声コミュニケーションへの影響も気になるところです。マスクによる最も大きな弊害は、口元が見えないという点です。聴覚障害のある方々にとって、口の形を読むことが音声聴取の大きな助けになります。また、お年寄りや外国人にとっても、口や顔を見ながらの会話は音声コミュニケーション上、とても重要です。

また、マスクによって音声そのものも変化します。そこで、マスクのあり・なしがどのように音声に影響するかを調べてみました。

例えば、次のようなアナウンス音声の1フレーズに着目します。

「冬が過ぎてしばらくすると、」

これを、マスク無し、有りの順番で聞いてみましょう:

(a) speech_M0.wav
(b) speech_M1.wav

これらの音声の録音には、森唯菜さんにご協力いただきました(録音は2021年2月)。

森さんには、(a)ではマスクをせずに、(b)ではマスクを着けて原稿を読んでもらいました。もともと、森さんの音声の特徴は子音がはっきりと発音されていることにあると感じていました。ですので、両者の差はそれほど大きくはなく、マスクを着けてもしっかりと子音が聞こえていました。それでは、少しも差はなかったのでしょうか。そこで、上の2つの音声について、サウンドスペクトログラムによるスペクトル分析を行いました。

この図において、左半分が(a)のマスク無しの条件、右半分が(b)のマスク有りの条件での分析結果です。そして共に横軸は時間、縦軸は周波数で、濃淡がその時間、その周波数における音の成分の強度を表しています(強いと濃い黒になる)。例えばちょうど真ん中辺り(1.6 s付近)を比較してみましょう。ちょうど、「しばらく」の「し」の子音部分に該当するところです。左右を比較すると、色の濃さが違うことが分かるでしょう。左が濃くて、右が薄い、すなわちマスクをすることによって子音が弱くなってしまっていることがこれで見てとれます。マスクをすることで、5 kHzくらいから上の高い周波数において音の成分が弱くなることが分かりました。これは最近の報告とも一致します。マスクをしながら聞きやすいアナウンス音声を目指すには、子音を特に注意することが重要です。

緊急事態宣言中での録音となったため、森さん自身に録音をしていただき、実験者(荒井隆行)はZoomを介して森さんと連携させていただきました。録音には、マイクロフォン(Marantz, MPM-2000U)と音声分析ソフトウェアPraat、そしてマスクはHenry Schein Dental Mask (996-0069) を使用しました。ご協力いただきました森唯菜さん、どうもありがとうございました。

  1. M. Magee et al., “Effect of face masks on acoustic analysis and speech perception: Implications for peri-pandemic protocols,” J. Acoust. Soc. Am., 148, 3562-3568, 2020