Zum Inhalt

softpinna

Non-rigid registration for the calculation of head-related transfer functions

Programm / Ausschreibung Bridge, Brückenschlagprogramm, 28. Ausschreibung Bridge 1 Status abgeschlossen
Projektstart 01.07.2019 Projektende 31.03.2023
Zeitraum 2019 - 2023 Projektlaufzeit 45 Monate
Keywords spatial audio; binaural virtual acoustics; non-rigid registration; 3-D geometry; head-related transfer functions

Projektbeschreibung

Kopfhörer sind Teil unseres Alltags, ob wir nun Musik hören, Filme ansehen oder mit unseren Mitmenschen über Telefon oder Computer kommunizieren. Mit Kopfhörern werden Töne in der Regel aber im Kopf wahrgenommen, wir verlieren also die natürliche Information über die räumliche Herkunft der Schallsignale. Dieser Verlust führt zu einer begrenzten und teilweise unrealistischen Wahrnehmung.
Ohne Kopfhörer wird die akustische Information einer Geräuschquelle durch unseren Körper beeinflusst. Speziell die Form des Ohres modifiziert Geräusche abhängig von ihrer Herkunftsrichtung. Diese richtungsabhängigen Veränderungen werden durch die sogenannten „head-related transfer functions“ (HRTFs) beschrieben. Da die Form des Ohres individuell wie ein Fingerabdruck ist, sind HRTFs äußerst personenspezifisch. Bei Kopfhörerwiedergabesystemen bleiben diese HRTFs aber leider meist unberücksichtigt. Dies liegt zum großen Teil an Schwierigkeiten bei der Erfassung der Form der Ohren einer Person.
Das grundlegende Ziel von softpinna ist daher die Entwicklung und Untersuchung neuer Methoden für eine einfache Erfassung von Ohrgeometrien einer Person. Dabei werden sogenannte „non-rigid registration“ (NRR) Algorithmen untersucht und weiterentwickelt: Aus Fotos einer Person werden 3-D Geometrien der Ohren errechnet und mit NRR-Algorithmen derartig verbessert, dass über Computersimulationen personenspezifische HRTFs genau berechnet werden können. Mit diesen personenspezifischen HRTFs wird es Kopfhörerwiedergabesystemen möglich sein, räumliche Schallsignale realistisch darzubieten. Die neue Methode zu Erfassung personenspezifischer Ohrgeometrien wird den technischen Aufwand für die HRTF-Erfassung drastisch reduzieren und zur Verbreitung realistischer Kopfhörerwiedergabesysteme beitragen.

Abstract

Millions of people use headphones everyday for listening to music, for watching movies, or when communicating with others. Nevertheless, the sounds presented via headphones are usually perceived inside the head and not at their actual natural spatial position. This limited perception is inherent and results in unrealistic listening situations.
When listening to a sound without headphones, the acoustic information of the sound source is modified by our head and our torso, an effect described by the head-related transfer functions (HRTFs). The shape of our ears contributes to that modification by filtering the sound depending on the source direction. But the ear is very listener-specific – its individuality is similar to that of a finger print, and thus HRTFs are very listener-specific. When listening to sounds via headphones, the listener-specific filtering is usually not available. One of the main reasons is the difficulty in the process of acquisition of the ear shape of a person, and thus in calculation of listener-specific HRTFs.
Thus, in softpinna, we will work on the development of new methods for a better acquisition of listener-specific ear shapes of a person. Specifically, we will investigate and improve the so-called “non-rigid registration” (NRR) algorithms, applied on 3-D ear geometries calculated from 2-D photos of a person’s ears. The improvement in the quality of the 3-D ear geometries acquisition will allow computer programs to accurately calculate the listener-specific HRTFs, thus enabling the incorporation of listener-specific HRTFs in future headphone systems providing realistic presentation of spatial sounds. The new ear-shape acquisition method will vastly reduce the technical requirements for accurate calculation of listener-specific HRTFs.