Skip to main content

Open Access Messung von Ausgeprägtheitsfunktionen bei den stimmlosen Plosiven /p/, /t/ und /k/ in Abhängigkeit von akustischen Merkmalen

Most of traditional experiments concerning perception deal with the acoustic cues of plosives. The plosives were either modified or synthesized and embedded in vocalic surroundings. Then they were presented to subjects in forced-choice-experiments for identification. In contrast to this traditional method of identification tests, the results of the present approach show that a direct measurement of the influence of selected acoustic cues on the perception of the plosives /p/, /t/ and /k/ is possible. This is achieved by the method of measuring a function called “Ausgeprägtheit”. The speech-stimuli (stimuli) used in the experiments are two-syllabic words consisting of a vowel-plosive-vowel (VCV) sequence.

The acoustic cues of the plosives varied are essentially the closure interval (closure) and the release burst (burst).

The experimental results - in the context of the vowel /a:/ - show that the burst of the plosives /t/ or /k/ is the dominant factor in the perceptual decoding of these speech sounds. For the case of the plosive /p/ neither the closure nor the burst are really sufficient for the recognition of this sound. Another point of view is the excellent characterization of the spectral properties of the burst by the midfrequency of its first dominant spectral maximum. This was found to be also important for the perception of each individual plosive. To demonstrate the context-dependent production and perception of voiceless plosives, experiments were designed where the frequency of the first spectral maximum of the plosive /k/ was varried stepwise towards lower frequencies within different vowel contexts (/a:/, /i:/, /u:/ and /∂/). The results of the experiments prove that the /k/-perception is essentially achieved by evaluating the frequency position of the first dominant spectral maximum of the release burst, taking the vowel context into account. Furthermore it was found that the second formant frequency of the vowel is approximately at the same position as the first spectral maximum of the /k/-burst.

Zusammenfassung

Viele der klassischen Experimente in der Sprachwahrnehmung beschäftigten sich mit den akustischen Merkmalen von modifizierten oder synthetisierten Plosivlauten, die eingebettet in vokalischer Umgebung Versuchspersonen zur Beurteilung nach dem ,,forced-choice“-Verfahren präsentiert wurden.

Im Gegensatz zu dieser klassischen Vorgehensweise wird durch die vorgestellten Experimente gezeigt, daß der Einfluß von akustischen Merkmalen auf die Wahrnehmung der Plosivlaute /p/, /t/ und /k/ direkt gemessen werden kann, indem die sogenannte ,,Ausgeprägtheit“ in Abhängigkeit von bestimmten akustischen Merkmalen ermittelt wird. In den Experimenten werden Sprachteststimuli (Stimuli) bestehend aus zweisilbigen Wörtern von der Form Vokal-Plosiv-Vokal verwendet. Als akustische Merkmale der Plosive wurden in den Experimenten im wesentlichen die Verschlußpause (Pause) und das Plosionsgeräusch (Burst) systematisch variiert.

Die Versuchsergebnisse im Vokalkontext /a:/ zeigen, daß der Burst bei den Plosivlauten /t/ und /k/ selbst Hauptträger der lautsprachlichen Information ist, während beim Plosiv /p/ weder die Pause noch der Burst zur eindeutigen Erkennung des Lautes notwendig sind. Außerdem zeigt es sich, daß bei den Plosiven /t/ und /k/ der Burst in erster Nährung durch die Frequenzlage des spektralen Hauptmaximums (Burstlage) gut beschrieben werden kann und dieses bei der Erkennung des jeweiligen Lautes wichtig ist.

Um die kontextabhängige Erzeugung und Erkennung von Plosivlauten zu zeigen, wurden Experimente durchgeführt, bei denen am Plosiv /k/ in unterschiedlicher Vokalumgebung (/a:/, /i:/, /u:/ und /∂/) die Burstlage von der jeweiligen Ruhelage ausgehend, zu niedrigeren Frequenzen hin verschoben wurde. Das Ergebnis der Experimente bestätigt, daß bei der Erkennung des /k/-Lautes die Auswertung der Frequenzlage des spektralen Hauptmaximums des Burst stark vom Umgebungsvokal abhängt und scheinbar relativ zur Lage des 2. Formanten des jeweiligen Vokals erfolgt.

Sommaire

Dans les expériences classiques sur la reconnaissance de la parole, on s'attache souvent à la mesure des caractéristiques acoustiques des consonnes plosives, modifiées ou synthétiques, en les enrobant d'un environnement vocalique et en les présentant aux personnes testées selon le processus du choix forcé.

Les expériences présentées ici s'écartent de ces procédures classiques et montrent que l'influence des caractéristiques acoustiques sur la perception des consonnes plosives /p/, /t/ et /k/ peut se mesurer directement en déterminant, en fonction de caractéristiques acoustiques bien spécifiées, une grandeur phonétique dénommée «expressivité». Les stimuli de parole utilisés dans ces expériences se composent de mots disyllabiques de la forme voyelle-consonne-voyelle. Les caractéristiques acoustiques significatives pour les plosives sont la pause d'occlusion et le bruit de plosion, parameters qu'on a fait varier systématiquement dans ces experiencés.

Les résultats concernant les expériences faites avec la voyelle contextuelle /a:/ ont montré que la plosion des consonnes /t/ et /k/ est elle-même porteuse principale de l'information consonantique, alors que pour la consonne /p/ ni la pause, ni la plosion ne sont indispensables pour une reconnaissance univoque de cette consonne. De plus, pour /t/ et /k/, la plosion peut se représenter, en bonne première approximation, par la position, sur l' échelle des fréquences, du principal maximum spectral du bruit de plosion, fait important pour la reconnaissance de ces consonnes.

Pour mettre en évidence l'influence du contexte sur la production et la reconnaissance des consonnes plosives, on a effectué des expériences sur la plosive /k/ enrobée des différents environnements vocaliques /a:/, /i:/, /u:/ et /∂/ et en deplacant vers les fréquences basses la position spectrale de la plosion. Les résultats ont confirmé le fait que, dans la reconnaissance de la consonne /k/, l'estimation de la position fréquentielle du maximum de la plosion dépend fortement de l'environnement vocalique et s'effectue apparemment à partir de la position du deuxième formant de la voyelle utilisée.

Document Type: Research Article

Publication date: 01 March 1988

  • Access Key
  • Free content
  • Partial Free content
  • New content
  • Open access content
  • Partial Open access content
  • Subscribed content
  • Partial Subscribed content
  • Free trial content