Skip to main content

Theory of Evolving Normal Modes and the Vocal Tract. Part II: Evolving Frequency and Amplitude

Buy Article:

$33.00 plus tax (Refund Policy)

Abstract:

The solution is sought of the two equations, the wave equation and adiabatic invariance equation [1], which govern an evolving normal mode in a time-varying acoustic pipe. It is assumed that the temporal deformations of the pipe are sufficiently slow to satisfy the adiabatic approximation condition. The time evolution of the frequency and the spatio-temporal behaviour of the amplitude function (i.e. the instantaneous mean-amplitude), are expressed as functionals of the pipe-area function. It is shown that: i) The time-dependent frequency does not differ to any great extent from the one which is furnished by the traditional quasi-time invariant model (characterized by the Webster equation), ii) The amplitude function, which remains undetermined within the framework of the quasi-time invariant model, is obtained here within the framework of our time-varying model; one important characteristic of this amplitude function is that it does not depend explicity on the temporal derivative of the area function.

These results hold for the vocal tract, because articulatory movements largely satisfy the condition of the adiabatic approximation. This explains why the various existant speech synthesis systems based on the quasi-stationary vocal tract model are able to produce high quality synthetic speech.

Zusammenfassung

Es wird eine Lösung von zwei Gleichungen gesucht, nämlich der Wellengleichung und der Gleichung adiabatischer Invarianz [1], welche eine veränderliche Eigenschwingung in einer zeitveränderlichen akustischen Leitung bestimmen. Es wird angenommen, daß die zeitlichen Veränderungen der Leitung genügend langsam erfolgen, so daß die Bedingung der adiabatischen Approximation erfüllt ist. Die zeitliche Entwicklung der Frequenz und raumzeitliche Verhalten der Amplitudenfunktion (d. h. des momentanen Amplitudenmittelwerts) werden als Funktionale der Rohrquerschnittsfunktion ausgedrückt. Es wird gezeigt, daß

i) die zeitabhängige Frequenz sich nicht erheblich von der unterscheidet, die sich aus dem herkömmlichen quasi-zeitinvarianten Modell (gekennzeichnet durch die Webster-Gleichung) ergibt.


ii) die Amplitudenfunktion, die im Rahmen des quasi-zeitinvarianten Modells unbestimmt bleibt, bei unserem zeitveränderlichen Modell erhalten wird. Ein wichtiges Kennzeichen dieser Amplitudenfunktion ist, daß sie nicht explizit von der zeitlichen Ableitung der Querschnitts-funktion abhängt.


Diese Ergebnisse gelten für den Stimmkanal, weil die Artikulationsbewegungen die Bedingung der adiabatischen Annäherung weitgehend erfüllen. Dies erklärt, warum verschiedene vorhandene Sprachsynthesesysteme auf der Grundlage eines quasi-stationären Stimmkanalmodells in der Lage sind, synthetische Sprache hoher Qualität hervorzubringen.

Sommaire

On construit la solution du couple d'équations (équation des ondes et équation de l'invariance adiabatique) qui gouverne un mode normal évolutif dans un tube acoustique de forme lentement variable dans le temps. Les déformations de ce tube sont supposées suffisamment lentes pour satisfaire la condition de l'approximation adiabatique de la mécanique. L'évolution temporelle de la fréquence et le comportement spatio-temporel de l'amplitude moyenne instantanée (fonction d'amplitude) d'un mode donné sont exprimés comme des fonctionnelles de la fonction d'aire du tube. Il ressort de cette étude que: 1°) la fréquence du mode diffère très peu de celle que fournit le modèle classique du conduit; 2°) la fonction d'amplitude (qui restait indéterminée dans le cas du modèle quasi-stationnaire) est obtenue ici dans le cadre d'un modèle non stationnaire. Une caractéristique essentielle de cette fonction d'amplitude est de ne pas dépendre explicitement de la dérivée temporelle de la fonction d'aire.

Cette étude s'applique très bien au conduit vocal, puisque les mouvements articulatoires satisfont dans une très large mesure à la condition de l'approximation adiabatique. Nos résultats expliquent ainsi pourquoi les divers systèmes existants de synthèse de la parole, tous basés sur le modèle quasi-stationnaire du conduit vocal, parviennent à produire de la parole synthétique de haute qualité.

Document Type: Research Article

Publication date: March 1, 1985

More about this publication?
  • Acta Acustica united with Acustica, published together with the European Acoustics Association (EAA), is an international, peer-reviewed journal on acoustics. It publishes original articles on all subjects in the field of acoustics, such as general linear acoustics, nonlinear acoustics, macrosonics, flow acoustics, atmospheric sound, underwater sound, ultrasonics, physical acoustics, structural acoustics, noise control, active control, environmental noise, building acoustics, room acoustics, acoustic materials, acoustic signal processing, computational and numerical acoustics, hearing, audiology and psychoacoustics, speech, musical acoustics, electroacoustics, auditory quality of systems. It reports on original scientific research in acoustics and on engineering applications. The journal considers scientific papers, technical and applied papers, book reviews, short communications, doctoral thesis abstracts, etc. In irregular intervals also special issues and review articles are published.
  • Editorial Board
  • Information for Authors
  • Subscribe to this Title
  • Information for Advertisers
  • Terms & Conditions
  • Ingenta Connect is not responsible for the content or availability of external websites
dav/aaua/1985/00000057/00000003/art00005
dcterms_title,dcterms_description,pub_keyword
6
5
20
40
5

Access Key

Free Content
Free content
New Content
New content
Open Access Content
Open access content
Subscribed Content
Subscribed content
Free Trial Content
Free trial content
Cookie Policy
X
Cookie Policy
Ingenta Connect website makes use of cookies so as to keep track of data that you have filled in. I am Happy with this Find out more