发音语音学(Articulatory phonetics) 研究的是:当口腔、咽喉和鼻腔中的各种器官对来自肺部的气流进行调节时,这些音素(phones)是如何产生的。
发音器官
图 14.4 展示了人类的发音器官。 声音由空气的快速运动产生。 人类在口语中发出的大多数声音,都是通过将肺部空气经气管(专业术语称为气管,trachea)推出,并从口腔或鼻腔排出而形成的。 当气流经过气管时,会穿过喉头(larynx)——俗称“喉结”或“声箱”。 喉头内有两片小肌肉褶皱,称为声带(vocal folds)(非专业场合常称作声 cords)。这两片声带可以靠拢或分开。 它们之间的空隙称为声门(glottis)。 如果声带彼此靠近(但未完全闭合),气流通过时会引起振动;如果声带张开较远,则不会振动。 由振动声带产生的声音称为浊音(voiced);不伴随声带振动的声音则称为清音(unvoiced) 或 无声音(voiceless)。 浊音包括 [b]、[d]、[g]、[v]、[z] 以及所有英语元音等。 清音则包括 [p]、[t]、[k]、[f]、[s] 等。

Figure 14.4 The vocal organs, shown in side view. (Figure from OpenStax University Physics, CC BY 4.0)
气管以上的区域称为声道(vocal tract),它由口腔声道(oral tract) 和 鼻腔声道(nasal tract) 组成。 空气离开气管后,可经口腔或鼻腔排出体外。 大多数声音是通过口腔气流产生的。 若气流经鼻腔排出,则形成鼻音(nasal sounds);这类声音(如英语中的 [m]、[n] 和 [ng])同时利用口腔和鼻腔作为共鸣腔。
音素主要分为两大类:辅音(consonants) 和 元音(vowels)。 这两类声音都是通过气流在口腔、咽喉或鼻腔中运动而形成的。 辅音是通过某种方式限制或阻塞气流而产生的,可以是浊音,也可以是清音。 元音的阻碍较少,通常是浊音,且一般比辅音更响亮、持续时间更长。 这些术语在语言学中的技术用法与日常用法大致相同: [p]、[b]、[t]、[d]、[k]、[g]、[f]、[v]、[s]、[z]、[r]、[l] 等属于辅音; [aa]、[ae]、[ao]、[ih]、[aw]、[ow]、[uw] 等属于元音。 半元音(semivowels)(如 [y] 和 [w])兼具两类特征:它们像元音一样是浊音,但又像辅音一样短暂且不具备明显的音节性。
辅音:发音部位
由于辅音是通过限制气流产生的,我们可以根据其最大限制点——即发音部位(place of articulation)——对它们进行分类(见图 14.5)。

图 14.5 英语主要的发音部位。
唇音(Labial):
主要由双唇闭合形成阻碍的辅音属于双唇音(bilabial)。
英语中的例子包括 possum 中的 [p]、bear 中的 [b],以及 marmot 中的 [m]。
英语中的唇齿音(labiodental) [v] 和 [f] 则是通过下唇抵住上排牙齿,让气流从上齿与唇之间的缝隙中通过而发出的。
齿音(Dental):
将舌尖抵住牙齿发出的声音称为齿音。
英语中的主要齿音是 thing 中的 [th] 和 though 中的 [dh]。发这两个音时,舌尖置于上齿后方,并略微伸入上下齿之间。
齿龈音(Alveolar):
齿龈(alveolar ridge)是上齿后方口腔顶部的一小块隆起区域。
大多数美式英语使用者在发 [s]、[z]、[t] 和 [d] 时,会将舌尖抵住齿龈。
术语冠音(coronal) 常用来统称齿音和齿龈音。
硬腭音(Palatal):
口腔顶部的硬腭(palate) 从齿龈后方向上急剧隆起。
龈后音(palato-alveolar) [sh](如 shrimp)、[ch](如 china)、[zh](如 Asian)和 [jh](如 jar)是通过舌叶(blade of the tongue)抵住齿龈后部隆起处发出的。
yak 中的硬腭音 [y] 则是将舌面前部靠近硬腭而发出的。
软腭音(Velar):
软腭(velum) 是口腔顶部最靠后的一块可活动的肌肉瓣膜。
[k](如 cuckoo)、[g](如 goose)和 [N](如 kingfisher)是通过舌根抵住软腭而发出的。
声门音(Glottal):
声门塞音 [q] 是通过关闭声门(即将声带完全闭合)而产生的。
辅音:发音方法
辅音还可以根据气流受阻的方式加以区分,例如是完全阻断气流,还是部分阻碍。 这一特征称为辅音的发音方法(manner of articulation)。 通常,结合发音部位和发音方法就足以唯一确定一个辅音。 以下是英语辅音的主要发音方法:
塞音(Stop) 是指气流在短时间内被完全阻断的辅音。 阻断之后,气流突然释放,产生爆破声。 阻断阶段称为闭塞(closure),释放阶段称为除阻(release)。 英语中有浊塞音,如 [b]、[d]、[g],也有清塞音,如 [p]、[t]、[k]。 塞音也被称为爆破音(plosives)。
鼻音(Nasal) [n]、[m] 和 [ng] 的发音方式是:降低软腭,使气流进入鼻腔。
在擦音(Fricatives) 中,气流受到狭窄通道的限制,但并未完全切断。 这种受限气流会产生湍流,发出典型的“嘶嘶”声。 英语的唇齿擦音 [f] 和 [v] 是通过下唇抵住上齿,在上齿与唇之间形成狭窄缝隙而产生的。 齿擦音 [th] 和 [dh] 则让气流从牙齿之间的舌边通过。 齿龈擦音 [s] 和 [z] 是将舌尖抵住齿龈,迫使气流从牙齿边缘挤出。 在龈后擦音 [sh] 和 [zh] 中,舌面位于齿龈后部,气流通过舌面上形成的沟槽挤出。 其中音调较高的擦音(英语中的 [s]、[z]、[sh] 和 [zh])被称为咝音(sibilants)。 若塞音紧接一个擦音,则构成塞擦音(affricates),例如英语中的 [ch](chicken)和 [jh](giraffe)。
在近音(Approximants) 中,两个发音器官彼此靠近,但距离不足以产生湍流。 例如,英语 [y](yellow)发音时,舌面接近硬腭,但未近到产生擦音所需的湍流程度。 [w](wood)则是舌根靠近软腭而发出的。 美式英语的 [r] 至少有两种发音方式:一种是仅舌尖伸起并靠近硬腭;另一种是整个舌头向硬腭方向聚拢。 [l] 的发音是将舌尖抵住齿龈或上齿,同时舌的一侧或两侧下降,使气流从舌侧通过。 由于气流从舌侧流出,[l] 被称为边音(lateral)。
闪音(Tap) 或 拍音(Flap) [dx] 是舌尖快速轻触齿龈的动作。 在大多数美式英语方言中,单词 lotus([l ow dx ax s])中间的辅音就是一个闪音; 而许多英国方言的使用者则会用 [t] 来代替这个音。
元音
像辅音一样,元音也可以通过发音时发音器官的位置来描述。 对元音来说,最重要的三个参数分别是所谓的舌位高低(vowel height),这大概与舌头最高部分的高度有关;舌位前后(frontness 或 backness),表明这一最高点是在口腔前部还是后部;以及嘴唇是否圆唇(rounded)。 图 14.6 展示了不同元音的舌位。

图 14.6 英语中的高前元音 [iy]、低前元音 [ae] 和高后元音 [uw] 的舌位。
例如,在元音 [iy] 中,舌头的最高点位于口腔前部。 相比之下,在元音 [uw] 中,舌头的最高点位于口腔后部。 将舌头抬升到口腔前部的元音称为前元音(front vowels);而将舌头抬升到口腔后部的元音则称为后元音(back vowels)。 请注意,尽管 [ih] 和 [eh] 都是前元音,但 [ih] 中舌头的位置比 [eh] 更高。 舌头最高点相对较高的元音称为高元音(high vowels);舌头最高点处于中等或较低位置的元音则分别称为中元音(mid vowels) 或低元音(low vowels)。
图 14.7 显示了一个简化的元音高度表征。 这是因为抽象属性“高度”仅大致对应实际的舌位;实际上,它更准确地反映了声学事实。 请注意,图表中有两类元音:一类以点表示舌位高度,另一类则以路径表示。 如果在一个元音发音过程中舌位有显著变化,则该元音称为双元音(diphthong)。 英语尤其富含双元音。

图 14.7 英语元音的简化“元音空间”。
元音的第二个重要发音维度是嘴唇的形状。 某些元音发音时需要圆唇(即发出哨声时所用的唇形)。 这些圆唇元音(rounded vowels) 包括 [uw]、[ao] 和 [ow]。
音节
辅音和元音结合形成一个音节(syllable)。 音节是由一个类似元音的(或响音(sonorant))声音及其最紧密相关的周围辅音组成的。 例如,单词 dog 有一个音节 [d aa g](在我们的方言中);而单词 catnip 则有两个音节,分别是 [k ae t] 和 [n ih p]。 我们称音节核心的元音为韵核(nucleus)。 如果有初始辅音,它们被称为声首(onset)。 如果声首包含多个辅音(如 strike 中的 [s t r ay k]),则称为复合声首(complex onsets)。 韵尾(coda) 是指跟在韵核之后的可选辅音或辅音序列。 因此,在 dog 中,[d] 是声首,而 [g] 是韵尾。 韵体(rime) 或 韵脚(rhyme) 是指韵核加上韵尾。 图 14.8 展示了一些样本音节结构。

将单词自动拆分为音节的任务称为音节划分(syllabification)。 音节结构也与一种语言的音位组合规则(phonotactics) 紧密相关。 术语音位组合规则(phonotactics) 指的是在一个语言中,哪些音位可以彼此跟随的限制。 例如,英语对哪些辅音可以在声首中共同出现有很强的限制;例如,序列 [zdr] 就不能作为合法的英语音节声首。 音位组合规则可以通过语言模型或有限状态模型来表示音位序列。