Mein erstes mittelhochdeutsches Hörbuch – Teil 1

Einleitung: Stefan liest

Nicht jede Lesung, nicht jede musikalische Interpretation eines mittelhochdeutschen Gedichts, die sich auf YouTube finden lässt, genügt wissenschaftlichen germanistischen Ansprüchen, aber wenn es nur darum geht, einmal einen Eindruck vom Klang der mittelhochdeutschen Sprache zu erhalten, dann wird man dort schnell fündig. Wer allerdings auf das Hören als Ersatz für das Sehen angewiesen ist, oder einfach nur den Wunsch verspürt, einen längeren mittelhochdeutschen Text anzuhören, anstatt ihn zu lesen, wird nicht nur auf den einschlägigen Plattformen vergeblich nach „Material“ suchen.

Das im folgenden Artikel vorgestellte Projekt versucht ein wenig Abhilfe zu schaffen. Es soll selbstverständlich nicht darum gehen, Hilfestellung bei der Einrichtung eines eigenen Tonstudios oder bei der Aufnahme eigener Lesungen zu geben. Nein, wir beabsichtigen, unseren Computer dazu zu bringen, uns einen mittelhochdeutschen Text vorzulesen und zwar so, dass wir ihn gut verstehen und seine Aussprache auch Fachleuten für das Mittelhochdeutsche keine Schmerzen verursacht. Die Ausgabe leiten wir dann in eine Audio-Datei, damit wir unser Hörbuch auf jedem uns genehmen Gerät abspielen können.

Das scheint auf den ersten Blick gar nicht so schwer zu bewerkstelligen: Schließlich lässt sich jedes Handy und jeder übliche Browser dazu bewegen, Texte vorzulesen. Dazu muss man allerdings teilweise eine zusätzliche App oder ein Add-On installieren. Das Betriebssystem eines Laptop- oder Desktop-Computer lässt sich natürlich ebenfalls um die Fähigkeit zur Sprachsynthese erweitern, wenn es diese nicht bereits von Haus aus mitbringt. Wer diesen Text beispielsweise auf einem Windows Rechner vor sich sieht, muss nur die  Strg-, die Windows– und die Enter-Taste gemeinsam betätigen, um die automatische Sprachausgabe zu aktivieren. Die auf meinem Rechner zu hörende Stimme von Windows10-Stefan klingt zwar manchmal etwas blechern, aber doch im Ganzen gut verständlich:

Ein ritter sô gelêret was,
daz er an den buochen las,
swaz er dar an geschriben vant:
der was Hartman genant,
dienstman was er zOuwe.

Nun ja, ein paar Worte hören sich etwas exotisch an  – ab und zu scheint Stefan bei fremdartigen Schreibungen zu vermuten, dass sie wohl englisch ausgesprochen werden müssen. Andere Wörter hingegen klingen viel zu vertraut. Kein Wunder! Stefan spricht und liest modernes Hochdeutsch und ahnt ja nicht, dass er in „dienstman“ einen Diphthong von sich geben soll. Probieren wir es gleich mit einem anderen Text als dem Armen Heinrich (Natürlich erkannt, oder?). Wie wäre es beispielsweise mit der Einleitung des Lanzelet des Ulrich von Zatzikhoven, eines ungefähren Zeitgenossen des gelehrten Ritters Hartmann von Aue?

Swer rehtiu wort gemerken kan,
der gedenke wie ein wîse man
hie vor bî alten zîten sprach,
dem sît diu welt der volge jach.

Das … klingt, zumindest von Stefan gelesen, schon weit weniger akzeptabel für mich. Jemand müsste Stefan ein paar Lektionen in der Aussprache mittelhochdeutscher Worte erteilen, bevor ich bereit wäre mir von ihm die fast 9500 Verse der an sich recht spannenden (und actionreichen!) Erzählung vom Artushof vorlesen zu lassen.

Dieser Gedanke soll der Ausgangspunkt für das heutige Projekt sein. Es gibt neben kommerziellen Angeboten zahlreiche Open-Source-Ansätze zur Spracherzeugung und -ausgabe, die Schnittstellen zur individuellen Anpassung und Programmierung bieten. Aber wir bleiben vorerst in der Microsoft-Umgebung und werden unsere Lösung in C# im Visual-Studio umsetzen. Größere Programmierkenntnisse brauchen wir dafür nicht und das ist der Hauptgrund für unsere Wahl. Zudem können wir uns in diesem Fall darauf verlassen, dass die Technologie stabil und fehlerfrei auf allen Rechnern läuft, auf denen Windows stabil und fehlerfr … Naja … auf denen halt …

Wer noch nie mit Visual-Studio oder C# gearbeitet hat, findet bei Verständnisfragen in reichem Maße Hilfe auf den Supportseiten von Microsoft. Dort kann er auch die (für private Zwecke) kostenlose Community-Version der Entwicklungsumgebung herunterladen:

Zum Download von Visual-Studio 2017

Als Übungstext verwenden wir nicht den gesamten Lanzelet-Roman, sondern beschränken uns vorerst bescheiden auf die ersten 49 Zeilen, die wir per copy & paste der Textfassung der Bibliotheca Augustana entnommen haben:

Lanzelet Verse 1 – 49

In Windows 10 per Rechtsklick das Kontextmenü öffnen und „Ziel speichern“ wählen, um den Text auf den eigenen Computer herunter zu laden und dort zu speichern. Jetzt ist alles vorbereitet. Wir können loslegen …

… und zwar im Teil 2.

Wer allerdings jetzt schon wissen will, was auf ihn zukommen wird, kann jetzt auch erst einen Blick auf den Tutorial-Überblick werfen:

Einleitung: Stefan liest

Wir klären die Aufgabenstellung: Ein mittelhochdeutscher Text soll durch Sprachsynthese korrekt wiedergegeben und die Ausgabe in eine Audio-Datei geleitet werden. Benutzt wird für das Tutorial die Programmierumgebung Visual-Studio und die Programmiersprache C#, um auf die von Microsoft vornehmlich zur Sprachausgabe auf Windows-Geräten entwickelte Technik zuzugreifen. Ein Übungstext von knapp 50 mittelhochdeutschen Verszeilen wird gewählt.

Hedda spricht (eine Zeile) Mittelhochdeutsch!

Eine Konsolen-Applikation wird erzeugt und in ersten kleinen Experimenten wird die von Microsoft angebotene Schnittstelle zur Sprachausgabe in C# vorgestellt. Der SSML-Standard wird erläutert, eine auf XML basierende Beschreibungsnorm für akustische Sprachdaten. Für das Tutorial wird die von Microsoft entwickelte Lautschrift UPS festgelegt, um phonetische Informationen an die Sprachsynthese zu übergeben, und diese Wahl begründet.

Der Blick ins Lexikon hilft!

Aus Textbausteinen lassen sich unter Verwendung eines PromptBuilders größere Einheiten zur flüssigen Ausgabe (Prompt) zusammenstellen. Für die weitere Arbeit legen wir eine Klasse an, der wir die für die Aufarbeitung des mittelhochdeutschen Textes notwendigen Aufgaben übertragen. Das Hauptprogram ist damit nur noch dazu da, den geschriebenen Text zu laden und die verarbeiteten Daten als Sprache auszugeben. Ein Lexikon wird in der neuen Klasse erzeugt, in dem den mittelhochdeutschen Graphien zugeordneten lautschriftlichen Einträge zu finden sind, die zur Lesung mittelhochdeutscher Wörter im Text verwendet werden. Die Leseroutine spaltet den Text in Wörter, die im Lexikon nachgeschlagen werden können. Vorerst werden nicht dort gefundene Worte (weiterhin) in neuhochdeutscher Lautung vorgelesen.  Es wird festgestellt, dass bei der Zuordnung von mittelhochdeutscher Schreibung und Lautschriftkodierung Regularitäten auftreten.

Von Lautschrift zu Lautschrift

Wir begreifen die normierte Orthographie klassischer mittelhochdeutscher Editionen primär als eine Lautschrift und formulieren als neue Aufgabenstellung unsere Absicht, eine Verschriftungsnorm in eine andere zu überführen. Dazu legen wir ein weiteres Lexikon an, in dem die korrespondierenden Zeichen der beiden Systeme zu finden sind. Die Probleme, die bei diesem Ansatz auftreten, werden dargestellt.

Die kleine Raupe Hedda

Das Lexikon wird vervollständigt und ein Programm zum Lesen des Textes erstellt, dass in der Lage ist, für jedes mittelhochdeutsche Wort im Text eine Lautschriftinterpretation auf Basis des Lexikons zu erzeugen. Dabei werden ein paar Tricks demonstriert, um den Workflow zu vereinfachen. Am Ende dieses Teil des Tutorials haben wir ein funktionsfähiges Programm zur rudimentären Ausgabe gelesener mittelhochdeutscher  Texte.

Bitte nochmal, mit mehr Gefühl!

Durch ein paar Verallgemeinerungen lässt sich erreichen, dass im Textausschnitt über 90 % der Wörter eine korrekte Betonung und Silbentrennung zugeordnet werden kann. Dazu werden u.a. die Nebensilben mehrsilbiger Wörter identifiziert und für einsilbige Funktionswörter anhand der Position im Vers entschieden, ob sie betont oder unbetont gelesen werden. Die in der Edition verwendeten Satzzeichen und die Versgrenzen werden genutzt, um Pausen zu setzen und Intonationskurven zu markieren. Einige dieser Aufgaben werden durch reguläre Ausdrücke gelöst, deren Syntax erklärt wird. Der nun erzeugte Hörtext, erlaubt es deutlich besser, Sinneinheiten wahrzunehmen.

Am Ende – Beinahe!

Die Ausgabe wird in eine Audiodatei wird geleitet. Der Programmcode wird für mögliche Erweiterungen und zukünftige Nutzungen optimiert und erweitert. Die Zusammenarbeit der Routinen zur automatisch generierten Lautschriftumsetzung und des Lexikons werden verbessert. Die Programmdateien können am Ende des Tutorials im Ganzen eingesehen werden.

Nach dem ersten mittelhochdeutschen Hörbuch

Das Tutorial hat sich eine Aufgabe gestellt und diese gelöst. In einer abschließenden Betrachtung wird überlegt, ob und wie sich die verwendete Methode auch für umfangreichere Projekte einsetzen lässt. Es wird skizziert, welche Erweiterungen notwendig wären, um die Erfahrungen der Hobbybastelei auf eine professionelle, wissenschaftlichen Ansprüchen genügende Basis zu stellen.

 

 

Veröffentlicht von

Doktor Tom

Klar, Studium der Computerlinguistik und Germanistik mit Spezialisierung auf das Mittelhochdeutsche. So gesehen Digital Humanist. Vor allem aber Tüftler, der Spaß an ungewöhnlichen Aufgabenstellungen und einfachen, aber effizienten Lösungen hat.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

I accept that my given data and my IP address is sent to a server in the USA only for the purpose of spam prevention through the Akismet program.More information on Akismet and GDPR.