Book Part Version of Record

Verfahren zur Schätzung der Grundfrequenzverläufe von Melodiestimmen in mehrstimmigen Musikaufnahmen

Author(s) / Creator(s)

Driedger, Jonathan
Müller, Meinard

Abstract / Description

Betrachtet man den einem Musikstück zugrunde liegenden Notentext, so lassen sich aus diesem Informationen wie der Verlauf einer Melodiestimme unmittelbar ablesen. Die Tonhöhen, Dauern und Einsatzzeiten der Melodietöne werden hierbei durch geeignete Notensymbole explizit kodiert. In einer Musikaufnahme sind die Verhältnisse wesentlich komplexer. Betrachtet man die Aufnahme eines auf einem Instrument gespielten oder gesungenen Tons, so kann man neben der Grundfrequenz auch eine Reihe von Obertönen und anderen Frequenzkomponenten messen. Weiterhin nehmen sich Musiker bei der Interpretation und Um¬ setzung eines Notentextes erhebliche Freiheiten. Neben der Anpassung von Tempo und Dynamik kann eine Melodiestimme zum Beispiel durch Verwendung von Vibrato und Glissando ausgestaltet werden. Bei der Betrachtung von mehrstimmiger Musik überlagern sich diese Phänomene und führen zu komplexen Klanggemischen. In diesem Beitrag diskutieren wir automatisierte Verfahren mit dem Ziel, den Grundfrequenzverlauf der dominanten Melodiestimme aus einer Musikaufnahme zu extrahieren. Hierbei wollen wir insbesondere auf Probleme eingehen, die bei der Betrachtung mehrstimmiger Musik entstehen. Weiterhin zeigen wir auf, wie sich die Resultate automatisierter Verfahren durch Integration von Zusatzwissen und durch Möglichkeiten der Benutzerinteraktion verfeinern lassen. Für die Anwendung der vorgeschlagenen Methoden stellen wir einen Prototyp für eine Benutzerschnittstelle zur Bestimmung von Grundfrequenzverläufen vor.
In the musical score, most information about the melody of a piece of music is given explicitly. The melody, which is often notated in a separate staff, is specified by a sequence of note symbols that encode the notes' pitches, onset times, and durations. A recording of the same piece of music constitutes a much more complex representation. The waveform of even a single note played on an instrument already consists of different frequency components, among them a fundamental frequency as well as a number of overtones. Furthermore, musicians make their performance more expressive by changing tempo and dynamics, by adding vibrato to played notes, or by smoothly connecting subsequent notes with glissandi. In a polyphonic music recording, all these effects and nuances superimpose to a complex sound mixture, in which the information about the melody is given only implicitly. As a result, the estimation of the sequence of fundamental frequency values, which represent the melody, is a challenging task. In this contribution, we discuss computational approaches for automatically estimating the fundamental frequency track of the dominant melodic voice in a polyphonic music recording. Furthermore, we show how the estimation result can be improved by integrating additional knowledge about the piece of music and by means of user interaction. Finally, we present a prototype of a user interface that integrates the presented techniques and functionalities for interactive fundamental frequency estimation.

Persistent Identifier

Date of first publication


Is part of

Auhagen, W., Bullerjahn, C. & von Georgi, R. (Hrsg.). (2015). Musikpsychologie. Jahrbuch der Deutschen Gesellschaft für Musikpsychologie. Band 25: Musikpsychologie - Anwendungsorientierte Forschung. Göttingen, Deutschland: Hogrefe.




Driedger, J. & Müller, M. (2015). Verfahren zur Schätzung der Grundfrequenzverläufe von Melodiestimmen in mehrstimmigen Musikaufnahmen. In W Auhagen, C Bullerjahn & R von Georgi (Hrsg.), Musikpsychologie. Jahrbuch der Deutschen Gesellschaft für Musikpsychologie. Band 25: Musikpsychologie - Anwendungsorientierte Forschung. Göttingen, Deutschland: Hogrefe.
  • Author(s) / Creator(s)
    Driedger, Jonathan
  • Author(s) / Creator(s)
    Müller, Meinard
  • PsychArchives acquisition timestamp
  • Made available on
  • Date of first publication
  • Abstract / Description
    Betrachtet man den einem Musikstück zugrunde liegenden Notentext, so lassen sich aus diesem Informationen wie der Verlauf einer Melodiestimme unmittelbar ablesen. Die Tonhöhen, Dauern und Einsatzzeiten der Melodietöne werden hierbei durch geeignete Notensymbole explizit kodiert. In einer Musikaufnahme sind die Verhältnisse wesentlich komplexer. Betrachtet man die Aufnahme eines auf einem Instrument gespielten oder gesungenen Tons, so kann man neben der Grundfrequenz auch eine Reihe von Obertönen und anderen Frequenzkomponenten messen. Weiterhin nehmen sich Musiker bei der Interpretation und Um¬ setzung eines Notentextes erhebliche Freiheiten. Neben der Anpassung von Tempo und Dynamik kann eine Melodiestimme zum Beispiel durch Verwendung von Vibrato und Glissando ausgestaltet werden. Bei der Betrachtung von mehrstimmiger Musik überlagern sich diese Phänomene und führen zu komplexen Klanggemischen. In diesem Beitrag diskutieren wir automatisierte Verfahren mit dem Ziel, den Grundfrequenzverlauf der dominanten Melodiestimme aus einer Musikaufnahme zu extrahieren. Hierbei wollen wir insbesondere auf Probleme eingehen, die bei der Betrachtung mehrstimmiger Musik entstehen. Weiterhin zeigen wir auf, wie sich die Resultate automatisierter Verfahren durch Integration von Zusatzwissen und durch Möglichkeiten der Benutzerinteraktion verfeinern lassen. Für die Anwendung der vorgeschlagenen Methoden stellen wir einen Prototyp für eine Benutzerschnittstelle zur Bestimmung von Grundfrequenzverläufen vor.
  • Abstract / Description
    In the musical score, most information about the melody of a piece of music is given explicitly. The melody, which is often notated in a separate staff, is specified by a sequence of note symbols that encode the notes' pitches, onset times, and durations. A recording of the same piece of music constitutes a much more complex representation. The waveform of even a single note played on an instrument already consists of different frequency components, among them a fundamental frequency as well as a number of overtones. Furthermore, musicians make their performance more expressive by changing tempo and dynamics, by adding vibrato to played notes, or by smoothly connecting subsequent notes with glissandi. In a polyphonic music recording, all these effects and nuances superimpose to a complex sound mixture, in which the information about the melody is given only implicitly. As a result, the estimation of the sequence of fundamental frequency values, which represent the melody, is a challenging task. In this contribution, we discuss computational approaches for automatically estimating the fundamental frequency track of the dominant melodic voice in a polyphonic music recording. Furthermore, we show how the estimation result can be improved by integrating additional knowledge about the piece of music and by means of user interaction. Finally, we present a prototype of a user interface that integrates the presented techniques and functionalities for interactive fundamental frequency estimation.
  • Publication status
  • Review status
  • External description on another website
  • Citation
    Driedger, J. & Müller, M. (2015). Verfahren zur Schätzung der Grundfrequenzverläufe von Melodiestimmen in mehrstimmigen Musikaufnahmen. In W Auhagen, C Bullerjahn & R von Georgi (Hrsg.), Musikpsychologie. Jahrbuch der Deutschen Gesellschaft für Musikpsychologie. Band 25: Musikpsychologie - Anwendungsorientierte Forschung. Göttingen, Deutschland: Hogrefe.
  • ISBN
  • Persistent Identifier
  • Persistent Identifier
  • Language of content
  • Publisher
  • Is part of
    Auhagen, W., Bullerjahn, C. & von Georgi, R. (Hrsg.). (2015). Musikpsychologie. Jahrbuch der Deutschen Gesellschaft für Musikpsychologie. Band 25: Musikpsychologie - Anwendungsorientierte Forschung. Göttingen, Deutschland: Hogrefe.
  • Dewey Decimal Classification number(s)
  • Title
    Verfahren zur Schätzung der Grundfrequenzverläufe von Melodiestimmen in mehrstimmigen Musikaufnahmen
  • Title
    Method for estimating the fundamental frequency characteristics of melody parts in polyphonic music recordings [Translated with]
  • DRO type
  • Visible tag(s)
    Version of Record