英語母語話者は摩擦音/s/と/sh/の知覚において、成人は主として摩擦のスペクトル形状に基づいて判断するのに対して、小児は摩擦のスペクトル形状よりもフォルマント遷移に注目して判断ており、さらに小児は加齢に伴って摩擦のスペクトル形状に基づいて判断するようになることが報告されています(Nittrouer et al., 1987; etc)。
日本語母語話者の成人を対象として、自然音声/sa/と/sha/の子音部分に対する重み付き加算による連続体と、遷移部分のフォルマント周波数を変化させた合成母音/a/の連続体を組み合わせた刺激音を聴取させ、/sa/か/sha/かを同定させたところ、参加者の多くはフォルマント遷移よりも摩擦のスペクトル形状に基づいて判断している傾向が認められました。 (平井ら, 2005, 2006)
刺激音は、まず子音部$C$と母音部$V$に分けてそれぞれを9種類ずつ合成し、それらを組み合わせて81種類を作成しました。子音部$C$の摩擦音については、実際の音声を基に作成しました。また母音部$V$については,Klatt(1984)によるフォルマント合成ソフトウェアXKLを用いて合成しました。
子音部については、/sh/から/s/にかけて9段階に連続的に変化する連続体$C_{1}, C_{2}, \cdots, C_{9}$を作成するため、以下のように/sh/と/s/に対して波形レベルでの重み付き加算を行いました:
$$C_{i}= (9-i)/8 *(/S/の波形)+ (i-1)/8 *(/s/の波形)$$
ここで、$i = 1, 2, \cdots, 9$でです。すなわち、$C_{1}$は/sh/そのものであり、$C_{9}$は/s/そ の ものです。また、子音部$C_{i}$の持続時間ははすべて100 msです。下の図に$C_{1}, C_{2}, \cdots , C_{9}$のスペクトル包絡の概略を示します。 この図を見るとわかるように、/sh/の$C_{1}$から/s/の$C_{9}$までスペクトルが連続的に変化します。(ただし,この図ではわかり易いように各線を少しずつプロットしながら示しています)。
母音部Vについては/a/に固定し、母音の冒頭にフォルマント遷移を付加することによって先行子音の知覚を与えることにしました。 そして、先行子音が/S/の場合のフォルマント遷移から、先行子音が/s/の場合のフォルマント遷移までを9段階に連続的に変化する連続体 $V_{1}, V_{2}, \cdots, V_{9}$を作成しました。そのフォルマント遷移に関する周波数 は,Nittrouer (2002)の数値を用いました。
/a/の第1フォルマント(F1)は,開始周波数の450 Hzから50 msで定常状態の650 Hzに達するものとしました。 $V_{1}$から$V_{9}$に渡ってF1曲線は同一のものを用いました。第2フォルマント(F2)の開始周波数は1570 Hzから40 Hzステップで1250 Hz まで9段階として、開始周波数から100 msで定常状態である1130 Hzに達するものとしました。 第3フォルマント(F3)の開始周波数は2000 Hzから58 Hzステップで2464 Hzまで9段階として、開始周波数から100 msで定常状態である2300 Hzに達するものとしました。
これらにより81種類の単音節$C_{i}V_{j}$が作成されました。$C_{1}V_{1}$が最も/sha/らしい刺激音,$C_{9}V_{9}$が 最も/sa/らしい刺激音です。
V9 | C1V9 | C2V9 | C3V9 | C4V9 | C5V9 | C6V9 | C7V9 | C8V9 | C9V9 |
---|---|---|---|---|---|---|---|---|---|
V8 | C1V8 | C2V8 | C3V8 | C4V8 | C5V8 | C6V8 | C7V8 | C8V8 | C9V8 |
V7 | C1V7 | C2V7 | C3V7 | C4V7 | C5V7 | C6V7 | C7V7 | C8V7 | C9V7 |
V6 | C1V6 | C2V6 | C3V6 | C4V6 | C5V6 | C6V6 | C7V6 | C8V6 | C9V6 |
V5 | C1V5 | C2V5 | C3V5 | C4V5 | C5V5 | C6V5 | C7V5 | C8V5 | C9V5 |
V4 | C1V4 | C2V4 | C3V4 | C4V4 | C5V4 | C6V4 | C7V4 | C8V4 | C9V4 |
V3 | C1V3 | C2V3 | C3V3 | C4V3 | C5V3 | C6V3 | C7V3 | C8V3 | C9V3 |
V2 | C1V2 | C2V2 | C3V2 | C4V2 | C5V2 | C6V2 | C7V2 | C8V2 | C9V2 |
V1 | C1V1 | C2V1 | C3V1 | C4V1 | C5V1 | C6V1 | C7V1 | C8V1 | C9V1 |
C1 | C2 | C3 | C4 | C5 | C6 | C7 | C8 | C9 |
- D. H. Klatt, The new MIT speech VAX computer facility, Speech Communication Group Working Papers IV, Research Laboratory of Electronics, MIT, Cambridge, pp.73-82, 1984.
- S. Nittrouer, Learning to perceive speech: how fricative perception changes, and how it stays the same, J. Acoust. Soc. Am., vol.112, no.2, pp. 711-719, 2002.
- S. Nittrouer and M. Studdert-Kennedy, The role of coarticulatory effects in the perception of fricatives by children and adults, J. Speech Hear. Res., vol. 30, no.3, pp.319-29, 1987.
- 平井沢子, 安啓一, 荒井隆行, 飯高京子, “日本語母語話者の摩擦音知覚における音響的手がかりについて,” 電子情報通信学会技術研究報告, 104(696):25–30, 2005.
- 平井沢子, 安啓一, 荒井隆行, 飯高京子, “日本語母語話者の摩擦音知覚の音響的手がかりについて,” 音声言語医学, 47, 75, 2006.