Voynich-Manuskript: Wo die Forschung ansetzen muss (Teil 3)

Voynich-Bar-2

 

Eine neue Forschungsarbeit zum Voynich-Manuskript hat einigen Wirbel ausgelöst. Mehrere Experten haben inzwischen Kritik daran veröffentlicht.

Eine der bekanntesten Hypothesen zum Voynich-Manuskript stammt vom britischen Linguisten Gordon Rugg. Wie Rugg 2004 einem Artikel in der Fachzeitschrift Cryptologia beschrieben hat, könnte der Voynich-Manuskript-Text mit folgender Methode entstanden sein: Man nehme einige Dutzend Buchstabenkombinationen oder Einzelbuchstaben (etwa QO, CHE, DY, QO, K, SHE, ODY, T, Y und einige weitere) als Bausteine und setze diese zu Fantasiewörtern und einem Fantasietext zusammen. Das Zusammensetzen erfolgt, indem man die Bausteine in eine Tabelle schreibt und in dieser mit Hilfe einer Schablone von einem Baustein zum anderen hüpft. Ein Fantasietext, der auf diese Weise entsteht, liest sich etwa wie folgt: QOTDY QOSHEY OCHEDY QOCHEDY QOKODY TY…

Voynich-100-2

Allerdings gibt es gegenüber Ruggs Hypothese einen offensichtlichen Einwand: Es liegen inzwischen etwa 20 statistische Untersuchungen vor, die belegen, dass der Text des Voynich-Manuskripts Ähnlichkeit mit natürlicher Sprache hat. Eine neue Untersuchung von Marcelo A. Montemurro und Damián H. Zanette deutet in die gleiche Richtung. Die Frage ist also: Kann man mit dem von Rugg vorgestellten (sehr einfachen) Verfahren wirklich Pseudotext generieren, der 20 typische Eigenschaften von natürlicher Sprache hat? Und das, ohne zu wissen, was man tut (der Urheber des Voynich-Manuskripts konnte vor 500 Jahren von Sprachstatistik noch keine große Ahnung haben)?

Auf den ersten Blick erscheint mir das ziemlich unwahrscheinlich. Doch Gordon Rugg, mit dem ich diese Woche schon ein paar E-Mails ausgetauscht habe, sieht das anders. Unter anderem schrieb er mir: “I think it’s perfectly possible for a text produced using the table and grille technique to have a lot in common with natural language.” In seinen Veröffentlichungen hat Rugg schon mehrere Parallelen zwischen natürlicher Sprache und einem nach seiner Methode generierten Text aufgezeigt. Allerdings hat er hierbei längst noch nicht alle statischen Eigenschaften des Voynich-Manuskript-Texts, die für natürliche Sprache sprechen, betrachtet.Hier und hier gibt es zwei Stellungnahmen Ruggs zur Arbeit von Montemurro und Zanette.

Inzwischen hat auch der Voynich-Manuskript-Experte Nick Pelling Kritik an der Arbeit von Montemurro und Zanette veröffentlicht. Er meint, dass die statistische Methode von Montemurro und Zanette gar nicht die Wörter mit dem höchsten Informationsgehalt identifiziert und daher die Schlussfolgerung der Autoren von vornherein falsch sein muss. Leider fehlt mir das lingustische Fachwissen, um das beurteilen zu können. Eine weitere Kritik gibt es von Stephen Chrisomalis. Er unterstützt die Meinung von Rugg, dass die Ergebnisse nicht zwingend für natürliche Sprache sprechen.

Letztendlich sind wir damit in der Diskussion wieder an einem Punkt angelangt, an dem schon viele Voynich-Diskussion stecken geblieben sind. Das Problem: Während wir die statistischen Eigenschaften des Texts inzwischen sehr gut kennen, steckt die Interpretation dieser Eigenschaften bisher noch in den Kinderschuhen. Es gibt einfach zu wenig Fachwissen darüber, wie Sprache, Textform, Kodierung und Verschlüsselung bestimmte Textsstatistiken beinflussen. Hier besteht noch großer Forschungsbedarf.

Einstweilen wissen wir deshalb noch nicht, ob das von Rugg vorgeschlagene Verfahren (vielleicht mit geringen Abwandlungen) Unsinnstext produzieren kann, der dem Voynich-Manuskript-Text so sehr ähnelt, dass wir die Hypothese als richtig betrachten können. Trotzdem (oder gerade deswegen) kann man natürlich nach wie vor daran zweifeln, dass dies möglich ist.

Vor Kurzem hat Gordon Rugg übrigens ein (wie ich finde sehr interessantes) Buch veröffentlicht. Es heißt „Blind Spot“. Das Voynich-Manuskript spielt darin nur eine Nebenrolle. Hauptsächlich  geht es um Psychologie. Die Aussage des Buchs kann man wie folgt zusammenfassen: Wenn es trotz großem Aufwand nicht gelingt, eine Frage zu beantworten, die eigentlich beantwortbar sein müsste, dann muss man überprüfen, ob die Frage überhaupt richtig gestellt ist. Als eine Anwendung dieses Prinzips stellt Rugg das Voynich-Manuskript vor. Seine These: Nachdem man es trotz größter Anstrengungen nicht geschafft hat, das Voynich-Manuskript zu entschüsseln, muss man sich fragen, ob es überhaupt entschlüsselbar ist. Nach Ruggs Meinung ist es das nicht. Stattdessen geht er davon aus, dass der Text mit der oben erwähnten Methode produziert wurde.

http://scienceblogs.de/klausis-krypto-kolumne/2013/06/27/voynich-manuskript-wo-die-forschung-ansetzen-muss-teil-3/

Voynich-Manuskript: Wo die Forschung ansetzen muss (Teil 1)

Voynich-Bar

Das Voynich-Manuskript (ein unlesbares Buch aus dem 15. Jahrhundert) ist das bekannteste ungelöste Kryptogramm der Welt. Auf eines kann man sich beim Voynich-Manuskript verlassen: Es gibt immer wieder neue Erkenntnisse, die mehr verwirren als zur Klärung beitragen. Genau das macht dieses Thema so faszinierend.

Das Voynich-Manuskript hat mir wieder einmal eine interessante Woche beschert. DieDreharbeiten für Galileo, bei denen das Manuskript eine wichtige Rolle spielte, waren dabei längst nicht alles. Ebenfalls bemerkenswert: Gestern hat das Nachrichtenportal der BBC einenArtikel über das Voynich-Manuskript veröffentlicht. Die BBC ist ja für Qualitätsjournalismus bekannt, und in diesem Fall wird der Sender seinem Ruf absolut gerecht. Für mich zählt dieser Artikel zum Besten, was es in den letzten Jahren in der Publikumspresse zum Voynich-Manuskript zu lesen gab (und es gab einiges zu lesen).

Allerdings bin ich bei meiner Einschätzung zugegebenermaßen etwas voreingenommen. Die Journalistin Melissa Hogenboom, die den Artikel geschrieben hat, hat mich beim Recherchieren kontaktiert und am Telefon befragt. Anscheinend haben ihr meine Antworten eingeleuchtet, denn sie finden sich fast alle im Artikel wieder. Außerdem werde ich ausführlich zitiert. So stelle ich mir guten Journalismus vor.

Voynich-100-1

Im Artikel kommen (erstmals in einer vergleichbaren Publikation) folgende Gesichtspunkte zur Sprache, die ich für besonders wichtig halte:

  • Es gibt etwa 25 statistische/linguistische Untersuchungen des Voynich-Manuskript-Texts.
  • Fast alle dieser Untersuchungen zeigen: Der Voynich-Manuskript-Text ähnelt natürlicher Sprache.
  • Es kristallisiert sich jedoch keine bestimmte Sprache heraus.
  • Es lassen sich keine Wörter identifizieren.
  • Es gibt ein paar wenige statistische/linguistische Untersuchungen, die Punkt 2 widersprechen. Sie besagen, dass der Voynich-Manuskript-Text keine natürliche Sprache sein kann.

Meiner Meinung nach lassen sich diese Ergebnisse nur wie folgt interpretieren: Der Voynich-Manuskript-Text muss eine Mischung aus natürlicher Sprache und künstlichen Einflüssen sein. Dafür gibt es verschiedene Möglichkeiten (die Auswahl ist nicht vollständig):

  • Ein gewöhnlicher Text wurde mit einem unkonventionellen Verschlüsselungs- oder Kodierverfahren bearbeitet. Es muss aber schon ein unkonventionelles Verfahren gewesen sein, denn eine bekannte Methode hätte man wohl inzwischen identifiziert.
  • Es liegt eine Kunstsprache vor, die natürliche Sprache als Basis verwendet.
  • Einzelne Wörter oder Silben aus natürlicher Sprache wurden auf künstliche Weise zu einem Text zusammengefügt. Der Linguist Jürgen Hermes hat eine Hypothese entwickelt, nach der die Wörter des Manuskripts jeweils für einen Buchstaben stehen und zusammen eine Nachricht ergeben. Diese Form des Verschlüsselns bzw. Versteckens von Text war in der Renaissance-Zeit durchaus bekannt.
  • Es handelt sich um den Aufschrieb eines psychisch gestörten Menschen, eines Menschen in Trance oder sonst eines Menschen, der Fragmente natürlicher Sprache sinnlos zusammenwürfelt. Vielleicht war es sogar ein Analphabet, der das Schreiben nur immitierte.

Meiner Meinung nach muss es ein wichtiges Ziel der Voynich-Manuskipt-Forschung sein, die diversen Möglichkeiten zu identifizieren und zu untersuchen. Hierbei ergibt sich jedoch ein Problem, das ebenfalls im Artikel angesprochen wird: Während man die statistischen Eigenschaften des Voynich-Manuskript-Texts inzwischen gut kennt, gibt es noch viel zu wenige Erkenntnisse darüber, wie solche Texteigenschaften im Einzelfall entstehen. Mit anderen Worten: Wir brauchen Forschung, die untersucht, wie Sprachen, Verschlüsselungsverfahren und Textformen (z. B. Gedichte, Gebete oder zufällig aneinander gereihte Wörter) statistische Eigenschaften eines Texts beeinflussen. Vielleicht kann man dann irgendwann sagen: Die statistischen Eingenschaften des Voynich-Manuskript-Texts sprechen eindeutig für einen lateinischen Prosatext, der mit dem Verschlüsselungsverfahren X in der Variante Y bearbeitet wurde.

Anlass für den BBC-Artikel war übrigens eine neue Forschungsarbeit, die ihrerseits für Diskussionen gesorgt hat. Um dieses Thema geht es im zweiten Teil dieses Beitrags.

http://scienceblogs.de/klausis-krypto-kolumne/2013/06/23/voynich-manuskript-wo-die-forschung-ansetzen-muss-teil-1/