
Eine Telefonansage kann inhaltlich perfekt sein, die richtige Stimme haben und gut klingen, und trotzdem am Telefon enttäuschend wirken. Der Grund liegt fast immer in der technischen Umsetzung. Falsche Dateiformate, fehlendes Mastering, eine Stereo-Datei auf einer Anlage, die nur Mono verarbeitet, oder ein Frequenzspektrum, das der Telefonübertragung nicht angepasst wurde, das alles führt dazu, dass eine professionell produzierte Ansage beim Empfänger dumpf, verzerrt oder zu laut klingt.
Dieser Artikel erklärt, was hinter der Technik einer Telefonansage steckt: welche Dateiformate Telefonanlagen tatsächlich benötigen, warum Telefon-Mastering kein optionaler Schritt ist, und wann bestehende Aufnahmen noch verwendbar sind und wann nicht.
Warum Telefonie eigene Anforderungen stellt
Musik und Sprache, die wir über Lautsprecher, Kopfhörer oder Streaming-Dienste hören, sind für einen breiten Frequenzbereich produziert. Ein gutes Audiosystem überträgt Frequenzen von etwa 20 Hertz bis 20.000 Hertz, also den gesamten Bereich, den das menschliche Ohr wahrnehmen kann.
Telefonie funktioniert anders. Das klassische Festnetz überträgt einen stark eingeschränkten Frequenzbereich von etwa 300 bis 3.400 Hertz. Alles darunter und darüber geht verloren. Das bedeutet: Tiefe Bässe und sehr hohe Höhen, die im Studio wunderbar klingen, kommen beim Anrufenden schlicht nicht an. Stattdessen klingt die Ansage dumpf, wenn zu viel Tieffrequenz vorhanden ist, oder schrill und verzerrt, wenn hohe Frequenzen nicht beschnitten wurden.
VoIP-Systeme und moderne Cloud-Telefonanlagen übertragen oft einen etwas breiteren Frequenzbereich, aber auch hier gelten andere Maßstäbe als in der Studioaudioproduktion. Wer seine Telefonansage ohne telefonspezifische Anpassung produziert, nimmt in Kauf, dass das Ergebnis schlechter klingt, als es sein müsste.
Audioformate: Was Telefonanlagen wirklich akzeptieren
Die häufigste Frage bei der technischen Übergabe einer fertig produzierten Telefonansage lautet: In welchem Format soll die Datei geliefert werden? Die Antwort ist leider keine einheitliche, denn verschiedene Telefonanlagen haben verschiedene Anforderungen.
WAV ist das meistverbreitete Format im Telefoniebereich. Der Name täuscht allerdings darüber hinweg, dass es nicht das eine WAV-Format gibt, sondern viele verschiedene Varianten, die sich in Samplerate, Bittiefe und Codec unterscheiden.
Die in der Telefonie häufigsten WAV-Varianten sind:
- WAV PCM 8 kHz, 16 Bit, Mono: Der am weitesten verbreitete Standard für klassische Telefonanlagen
- WAV PCM 16 kHz, 16 Bit, Mono: Für neuere Anlagen und VoIP-Systeme mit besserer Klangqualität
- WAV A-Law 8 kHz, 8 Bit, Mono: Ein komprimiertes Format, das in europäischen Telefonsystemen seit Jahrzehnten Standard ist und auf dem G.711-Codec basiert
- WAV µ-Law 8 kHz, 8 Bit, Mono: Das nordamerikanische Pendant zu A-Law, in europäischen Anlagen selten, aber manchmal anzutreffen
MP3 wird von vielen modernen Telefonanlagen ebenfalls akzeptiert, vor allem von VoIP-Systemen und Cloud-Plattformen. Bei Anlagen, die sowohl WAV als auch MP3 unterstützen, liefert MP3 oft die bessere Klangqualität, weil das Format flexibler mit dem eingeschränkten Frequenzbereich der Telefonie umgeht. Typische Anforderungen sind hier 128 kbps, Mono.
Eine Anforderung gilt dabei für praktisch alle Telefonanlagen ohne Ausnahme: Die Datei muss in Mono vorliegen. Stereo-Dateien werden entweder abgelehnt oder so zusammengemixt, dass Phasenauslöschungen entstehen, also Klanganteile, die sich gegenseitig aufheben und zu einem hohlen, unnatürlichen Klang führen.
Wie findet man heraus, welches Format die eigene Anlage braucht?
Am direktesten geht das über das Handbuch der Telefonanlage, das beim Hersteller meist als PDF verfügbar ist. Suchbegriffe wie „Audioformat“, „MOH“, „Music on Hold“, „Ansage vor Melden“ oder „Audioinput“ führen meist schnell zur richtigen Stelle. Wer unsicher ist, kann beim Telefonanbieter oder bei der eigenen IT-Abteilung nachfragen. Bei klangfarbe übernehmen wir die Klärung des richtigen Formats auf Wunsch direkt und liefern die fertigen Dateien so, dass sie ohne Zwischenschritt eingespielt werden können.
Telefon-Mastering: Warum dieser Schritt unverzichtbar ist
Mastering ist der letzte Schritt in der Audioproduktion, bei dem eine fertig gemischte Aufnahme so bearbeitet wird, dass sie in der jeweiligen Wiedergabeumgebung optimal klingt. Für Telefonansagen bedeutet das eine Anpassung an die spezifischen Bedingungen der Telefonie.
Was beim Telefon-Mastering konkret passiert:
- Erstens wird ein Low-Cut gesetzt, also ein Hochpassfilter, der tiefe Frequenzen unterhalb von etwa 200 Hertz abschneidet. Diese Frequenzen werden von Telefonsystemen ohnehin nicht übertragen, erzeugen aber im Audiomaterial Energie, die die Lautheit der Datei beeinflusst und zu Verzerrungen führen kann.
- Zweitens wird ein High-Cut gesetzt, also ein Tiefpassfilter, der hohe Frequenzen oberhalb von etwa 7.000 bis 8.000 Hertz abschneidet. Zu aggressive Absenkung macht die Ansage dumpf, zu wenig Absenkung führt zu scharfen, unangenehmen Klängen über das Telefon.
- Drittens wird die Lautheit normiert. Telefonanlagen haben oft eigene Lautstärkeregulierungen, und eine Ansage, die zu laut oder zu leise angeliefert wird, klingt am Endgerät entweder verzerrt oder kaum hörbar. Ein professionelles Mastering liefert die Datei mit einem definierten Lautheitspegel, der zur Anlage passt.
- Viertens wird die Dynamik bearbeitet. Sprache hat eine natürliche Dynamik, also Lautstärkeunterschiede zwischen leisen und lauten Stellen. In der Telefonie ist zu viel Dynamik problematisch, weil leise Passagen im Hintergrundrauschen untergehen und laute Passagen verzerren können. Eine moderate Kompression sorgt dafür, dass die Ansage gleichmäßig verständlich klingt.
All das klingt technisch, hat aber eine sehr direkte Auswirkung auf das, was Anrufende hören. Eine Ansage ohne Telefon-Mastering kann selbst bei hochwertiger Studioaufnahme am Telefon unprofessionell, dumpf oder anstrengend klingen.
VoIP und Cloud-Telefonanlage: Was sich technisch ändert
Viele Unternehmen steigen von klassischen Festnetzanlagen auf VoIP oder Cloud-basierte Telefonieplattformen um. Das hat Auswirkungen auf die technischen Anforderungen an Telefonansagen.
VoIP-Systeme übertragen in der Regel einen etwas breiteren Frequenzbereich als das klassische Festnetz, was grundsätzlich für bessere Klangqualität sorgt. Gleichzeitig sind die Formatanforderungen bei Cloud-Systemen oft flexibler, MP3 wird häufiger akzeptiert, und die Dateiverwaltung läuft über webbasierte Oberflächen statt über hardwaregebundene Systeme.
Das bedeutet: Ansagen, die für eine ältere Festnetzanlage produziert wurden, müssen bei einem Systemwechsel möglicherweise nicht neu aufgenommen, aber technisch neu aufbereitet werden. Eine Datei im A-Law-Format für eine klassische Anlage kann auf einer modernen VoIP-Plattform problemlos als MP3 neu exportiert werden, wenn die Originaldatei noch vorhanden ist.
Das ist auch einer der Gründe, warum bei klangfarbe alle Projektdaten als offene Projektdatei für mindestens drei Jahre archiviert werden. Bei einem Systemwechsel oder einer technischen Anpassung muss nichts neu produziert werden, sondern nur neu ausgeliefert.
Mehr dazu, wie wir Updates und Pflege bei laufenden Projekten handhaben.
Bestehende Aufnahmen weiterverwenden: wann ja, wann nein
Eine häufige Frage, die sich stellt, wenn ein Unternehmen seinen Telefonauftritt überarbeiten möchte: Können bestehende Aufnahmen weiterverwendet werden?
Die Antwort hängt von mehreren Faktoren ab.
- Technische Qualität.
Wenn die bestehende Aufnahme in einem professionellen Studio entstanden ist und als hochwertige Rohdatei vorliegt, lässt sie sich oft technisch optimieren oder neu mastern, ohne neu aufnehmen zu müssen. Wenn die Aufnahme im Büro mit einem einfachen Mikrofon entstanden ist, ist eine Neuproduktion in den meisten Fällen effizienter. - Aktualität der Sprecher:in.
Wenn die Stimme der verwendeten Sprecher:in noch verfügbar ist und neue Module im gleichen Klang produziert werden können, ist das eine gute Basis für eine modulare Erweiterung. Wenn die Sprecher:in nicht mehr verfügbar ist, entsteht bei jeder Ergänzung ein klanglicher Bruch. - Inhaltliche Aktualität.
Wenn sich Öffnungszeiten, Abteilungsstrukturen oder der Unternehmensauftritt grundlegend verändert haben, ist oft eine Neuproduktion sinnvoller als das Flicken bestehender Aufnahmen. - Klangliche Konsistenz.
Wenn die bestehenden Aufnahmen klanglich nicht zusammenpassen, also etwa weil verschiedene Sprecher:innen ohne einheitliches Konzept aufgenommen wurden, ist eine vollständige Neuproduktion meistens die sauberere Lösung.
Was eine technisch sauber gelieferte Telefonansage ausmacht
Am Ende läuft eine technisch korrekte Telefonansage auf wenige klare Kriterien hinaus: richtiges Dateiformat für die jeweilige Anlage, Mono-Kompatibilität, telefonspezifisches Mastering mit angepasstem Frequenzbereich und normierter Lautheit, und eine klare Dateistruktur, die das Einbinden in die Telefonanlage unkompliziert macht.
Wer alle inhaltlichen und gestalterischen Entscheidungen richtig trifft, aber an der technischen Umsetzung spart, verschenkt einen Großteil der Wirkung. Und umgekehrt: Wer technisch sauber liefert, sorgt dafür, dass jede kreative und inhaltliche Entscheidung auch tatsächlich beim Anrufenden ankommt.
Wie wir Aufnahme, Produktion und technische Umsetzung bei klangfarbe handhaben, erklärt unsere Seite zu Produktion und Umsetzung.
Sie haben Fragen zur technischen Umsetzung Ihrer Telefonansage?
In unserer FAQ-Übersicht finden Sie erste Antworten, oder nehmen Sie direkt Kontakt mit uns auf.
Mehr Informationen zu weiteren Themen im Bereich Audioproduktionen finden Sie auf unserer Hauptseite www.klang-farbe.com
Mehr Artikel aus unserem Magazin
Eine Telefonansage kann noch so gut klingen, am Ende des Tages ist es ein Mitarbeitender, der das Gespräch übernimmt.
Aktuelle Inhalte in den Telefonansagen für einen professionellen Eindruck

