Moderne Transceiver (TRX) werden immer noch mit "old-fashioned" PTT-Mikrofonen bei Voice-Betrieb genutzt. Im Gegensatz dazu werden die digitalen Betriebarten aber per USB betrieben. Warum eigentlich ? Wir quälen uns unnötiger Weise mit Übertragern, Mischpulten, Equalizern, Filtern und ähnlichem herum um das Optimum bei SSB herauszuholen. Warum nutzen wir nicht den (fast) rein digital Weg. Zugegeben, der erste Schritt wird immer noch durch Schallwellen (unsere Sprache) initiiert. Aber von dort an könnten wir eigentlich digital weitermachen. Was fehlt eigentlich und welche Vorteile bieten sich ?
Zuerst einmal die Steuerung. Das ist im Falle von ICOM (aber auch allen anderen in ähnlicher Art und Weise) durch das CI-V Protokoll recht perfekt umgesetzt. Wir müssen also die digitalen Audiosignale und die digitalen Steuersignale an den TRX senden und empfangen, um einen Funkbetrieb zu bekommen. Betrachten wir einmal die digitalen Schnittstellen moderner Transceiver am Beispiel des ICOM 7300.
ICOM bedient sich eines Silicon Labs CP2102 Chips (einer USB-TO-UART BRIDGE) für die Steuerung per CI-V Protokoll und eines Texas Instruments PCM2901 Audio Codec Chips für die digitale Audio Übertragung.
Wichtiger Hinweis bei Anschluss des TRX an einen Computer oder an den AudioMagic Server: Bitte verwenden Sie immer einen USB Digital Audio Signal Isolator um Brumm- und Masseschleifen zu verhindern.
Mit der gleichen Einstellung wie wir sie auch für die Nutzung digitaler Betriebsarten verwenden, können wir genauso gut auch Stimme übertragen und den Transceiver steuern. Was braucht es dazu ? Im simpelsten Fall (Theorie) eine schlichte Verbindung eines USB-Headsets (so wie sie auch Gamer verwenden) mit einer Fußtaste, die wie ein Computer-Keybard arbeitet. Nicht fehlen darf etwas Software, was das Keyboard (Fußtaste) in den Befehl "PTT" im CI-V Protokoll abschickt. Soweit die Theorie.
Mit dem richtigen Hang zur Programmierung und der Hilfe künstlicher Intelligenz eine unglaubliche Menge, denn wenn wir schon den analogen Pfad verlassen und ins Digitale wechseln, machen wir es richtig ! Betrachten wir erstmal die "alten Zöpfe" die wir damit abschneiden können !
Um diesen beiden Problemen zu begegnen, habe ich ca. 6 monate recherchiert und einen "Schlachtplan" entworfen, was eine Software können muss, bevor es an die Umsetzung ging.
Menschliche Stimmen unterscheiden sich stark, nicht nur zwischen den Geschlechtern. Als Konsequenz muss also eine Stimmencharacterisierung her, die eine Stimmen-DNA erstellen kann bei der das Mikrofon ebenfalls eine Rolle spielt. Mikrofone haben unterschiedliche Characteristiken nicht nur in Bezug auf die Art der Schallwandlung (ein Kondensatormikrofon reagiert wesentlich empfindlicher als ein dynamische Mikrofon), sondern auch in Bezug auf die Richtcharcteristik wie Niere, Kugel, Acht und Keule, sowie die Größe des Schallwandlers (eine Großmembran klingt voller als ein kleines Ansteckmikrofon).
Wie characterisiert man nun diese "Klangwelt". Hier fiel mir bei der Recherche das Projekt "VOXplot" auf. VOXplot ist eine Open-Source-Software für die objektive, akustische Stimmqualitätsanalyse. Sie dient Fachleuten wie Logopäden und Sprachwissenschaftlern dazu, Stimmstörungen (wie Heiserkeit oder Behauchtheit) zuverlässig zu bewerten. Soweit die Beschreibung und damit eigentlich nicht das was wir suchen. Aber die Idee dahinter ist bestechend. Ein System bestimmt die Stimm & Mikrofon DNA nach bestimmten Kriterien einfach durch Sprechen eines Mustersatzes, gefolgt von "AAAAAAA". Hier einmal die durch die Analyse zu bestimmenden Werte:

Die Charakteristik selbst wie Körper, Boom, Klarheit, Dynamik, Hart, Nasal, Rumpel, Zischlaute; Die Energie der Stimme in Peak_dB, sowie RMS_dB; und die Umgebungs-Geräusche Noise_floor_dB.
Soweit, so gut - die Stimme ist also standardisiert characterisierbar! Jetzt galt es ein "Modulationssystem" (Voice-Engine) zu kreieren, welches jede Stimme in Richtung DX, PileUp, Ragchew und Broadcast zu verfeinern. Bei einer tiefgehenden Recherche kamen dabei folgende notwendigen Characteristiken heraus, würde die Stimme "neutral" sein, was sie aber niemals ist. Daher beeinflusst schon hier der Equalizer das Klangbild entsprechend der Stimm-DNA:
Ziel: Entspanntes Zuhören über längere Zeit. Die Stimme soll warm, nah und ermüdungsfrei klingen, ohne künstlich zu wirken.
Ziel: Die Stimme muss durch Rauschen (QRN) und atmosphärische Störungen lesbar bleiben. Natürlichkeit wird zugunsten von Artikulation geopfert.
Ziel: Absolute Dominanz auf der Frequenz. Durchdringen von starkem QRM (anderen Stationen). Die Stimme wird zu einer akustischen Waffe geformt.
Ziel: "Voice of God". Breitbandig, extrem bassig, wie ein Radiomoderator (Podcaster). Benötigt ein sehr gutes, störungsfreies Signal.
Das System wendet diese Werte nicht blind an. Die Sensorik misst die Stimm-DNA (z.B. Body, Nasal, Harsh, Sibilance) und modifiziert die oben genannten Zielwerte dynamisch:
Was könnten wir noch hinzufügen ? Profile: In der jetzigen Softwareversion stehen eine Anzahl Profile für Stimm / Mikro Kombinationen bereit sowie ein Profil für das Mikrofon des Computers bereit. Um die Stimm / Mikro DNA zu nehmen sind nur wenige Schritte notwendig. Einpegeln des Mikrofons, Aufnahme der "Stille" um das Raumprofil zu bestimmen, den Testsatz sprechen, fertig. Damit ist AudioMagic auch gleichzeitig entweder für mehrere Mikrofone und einer Person gerüstet, oder mehrere Personen und ein Mikrofon oder auch eine Kombination von beidem.
Ach ja, ein Workflow orientierter Voice-Keyer wäre auch noch schön ! - Keine Sorge ist auch drin !
Hier ein Screenshot aus der Praxis

Testaufnahmen mit einem Behrnger Ultravoice XM8500 (ca. 20 Euro) PassThru DX PileUp Ragchew Broadcast
Testaufnahme mit einem Electrovoice RE20 (ca. 670 Euro) PassThru DX PileUp Ragchew Broadcast
Testaufnahme mit einem Corsair HS80 USB Gamer Headset PassThru DX PileUp Ragchew Broadcast