DrPagel-FavIcon
« »

Verfasst am 23.08.2007 17:02:52 Uhr
Israelisch-Hebräisch Text-to-speech (TTS) Teil3
Fortsetzung vom 21.8.2007 (Teil2) (vom 12.8.2007 (Teil1))

Aufatmen! Es ist vollbracht! Eigentlich wollte ich ja jetzt einkaufen, keine teure Software, nein Softeis u.s.w., aber ich muss das Ergebnis der Suche erst einmal festhalten, weil es sonst fast nicht reproduzierbar ist.

Erschwerend kommt hinzu, dass ich immer noch keine hebräischen Schriftzeichen auseinanderhalten kann, außer dem "alef"-Zeichen "א" oder dem kartoffelerntegabel-ähnlichen Symbol "ש", welches dem kyrillischen Zeichen "ш" ähnelt und wie (dts.:) "sch" ausgesprochen werden soll.

Es war auch mit seiner möglichen hebräischen Übersetzung unter dem Suchwort "TTS" (text to speech (engl.)) außer einer Literatur über Text und Sprache und außer der im früheren Beitrag berichteten kostenpflichtigen "Kolan"-Applikation, nichts passendes zu finden.

Rechts neben "TTS" in dieser Melingo-Seite stand ein google-Suchbegriff "טכנולוגיית", der eher auf Webseiten mit "Power" und "Technik" zielte. Rechts neben "(Context)" in dieser Melingo-Seite stand ein weiterer möglicherweise interessanter google-Suchbegriff"תחביר – ניתוח הקשר". Hiermit wurde die Lit. "MFS users Manual 5.02" (Doc-Datei, HTML-Datei) gefunden und darin das Suchwort "הקראת טקסטים" markiert, welches rechts vor dem Ausdruck "(Text to Speech)" stand. Hierdurch wurde die ReadIt-URL von google auf den vordersten Rang projektiert / projiziert. Zuerst "inspizierte" ich noch eine gleichnamigen Text-HTML-datei und fand dort diesen Wink mit diesem Glücksschmetterling:

Schmetterling

...und las das Schlüsselwort תוכנת", welches "read it" (engl.) bedeutet. Also denken sich die Israelis ein Kommando "read the text" anstelle von "speak the text" oder einer nichtemotionalen "Substantivierung "text to speech" aus. Öfters mal über den Tellerrand in andere Sprachkulturen geschaut und neue Ideen der Wortgestaltung entdeckt!

So heisst also mein empfohlenes offline-Programm "ReadIt". Das Programm habe ich mir von dieser Webseite (unter dem Menüpunkt "MB לחץ כאן להורדה 22 ") heruntergeladen.

Es ist so intelligent, dass es bereits beim Editieren dieses Weblogbeitrages mitliest, laut mitspricht (Vorsicht bei der Kennworteingabe: Feind hört mit!), selbsttätig die Abkürzung / das Akronym TTS als "text to speech" vorliest und je nach benutztem Schriftzeichen-Code (lateinisch, hebräisch) eine englischsprachige Männerstimme bzw. eine hebräischsprachige Frauenstimme vorspricht und zwar sehr deutlich, nicht so schwerverständlich wie bei meinem am 28.8.2007 berichteten "NaturalReader"-Beitrag. Ich bin voll des Lobes.

Da ich kein Hebräisch lesen kann, habe ich zwecks Installation unter Windows XP fast ausnahmslos darauf vertraut, die auf hebräisch geschriebenen unleserlichen Menütexte von ReadItSetup.exe richtig bedient zu haben. Immerhin war die AGB in Lateinbuchstaben geschrieben. Registriert habe ich mich nicht, denn da weiss ich garnicht, was man in die Formularfelder eintragen sollte. Dort steht lesbar eine ePost-Adresse "Yariv_z at 012.net.il", viele Fragezeichen auf den Button, eine Zahl 84300, eine 30, eine rote 29 (wohl die restlichen freien Testtage) und viele unlesbare Lateinschrift-Sonderzeichen. Ich habe auf den oberen mittleren Button mit der schwarzen "-30" gedrückt und damit das Programm gestartet.

Vielleicht ist die Benutzung nur heute oder innerhalb von 4Wochen kostenfrei? Keine Ahnung! Zumindest die analoge Telefonleitung ist frei geblieben. Da diese Software ja nicht für den deutschen Markt produziert wurde ist möglich, dass eine versteckte Dialerfunktion installiert worden ist, wovon ich noch nichts weiss, so dass über eine andere Institution abgerechnet werden würde. Ich werde es wohl erst nach einem Monat an der Telefonrechnung wissen, ob diese Anwendung eine gratis-Software ist. Dann werde ich darüber berichten.

Man kann die offline ReadIt-Applikation mit dem rechten Menübutton so einstellen:
  • Speak Clipboard
  • Delay of ReadIt F11
  • hebrew menu oder english menu
  • options:
    • voice Alt+S
    • activate
      • Read on-line: []No, []Letters, []Words
      • Read with: []Double click, []Control button
      • Type 'nikud' (i.e. diakritische "Vokalzeichen")
    • Punctuation
      • Read punctuation: []Some, []All
      • []Read digits
      • []Read numbers
    • Screen reader
    • Text window
    • Font ... (öffnet das bekannte Schriftartmenü)
    • Back reading F2
  • Position
    • Top Left
    • Top Right
    • Bottom Left
    • Bottom Right
  • About ... (öffnet ein Popupfenster mit Telefon- und Fax-Nummer und vielen Fragezeichen)
  • Close
Jetzt, wo ich diese israelische Software funktionstüchtig offline installiert habe, wäre es ja angeraten, mir meine Diss.Zus. ohne Rücksicht auf korrekte Satzstellung und Wortgrammatik zunächst mal automatisch mit dem UN-Translator übersetzen und mir mit "ReadIt"-TTS die Wörter vorlesen zu lassen, damit man zunächst eine deutsch-englisch-israelische Vokabelsammlung anlegen kann. Zu den mit einer netten ReadIt-Stimme vorgelesenen israelisch-hebräischen Wörtern könnte ich meine eigenen Latein-TransSkription erfinden und müsste nicht erst grübeln, wie ein Engländer diese romanisierten hebräischen Wörter lesen würde. Das ginge schneller, als wenn ich Buchstabe für Buchstabe diese "Fast-Hieroglyphen" in Lateinbuchstaben gemäß Tabelle umsetze. Gott zum Gruße! (dp) (+6,25h)

Nachtrag_1 am 30.8.2007 um 13.50Uhr:
Nachdem mir das ReadIt-Programm nun die Buchstaben und Wörter vorgelesen hat, steht fest:
  • Verschiedene Aussprachen am Beispiel des hebräischen Buchstaben (fe /) pe
  • es gibt noch ein Schluss-"pe", welches immer als "f" ausgesprochen wird: #1507; = ף
  • "pagel":
    • "pa" =: #1508;#1468;#1464; = פָּ
      oder #1508;#1468;#1463; = פַּ
    • "ge" =: #1490;#1462; = גֶ
    • "l" =: #1500; = ל

  • "log":
    • "lo" =: #1500;#1459; = לֳ
    • "g" =: #1490; = ג
  • "ag":
    • die Artikulation von "alef" alleine als auch mit nachfolgend gelisteten diakritischen "nikud"-Zeichen (plural: "nikudim") ergab durch ReadIt-Vorlesung immer "a" (siehe Übersicht zu Aussprachen von alef):
      • alef + #1458; = #1488;#1458; =
        אֲ oder
      • alef + #1463; = #1488;#1463; =
        אַ oder
      • alef + #1464; = #1488;#1464; =
        אָ
    • "g" =: #1490; = ג

  • "pagel.log.ag" =:
    • "פָּגֶל.לֳג.אג" oder
    • "פָּגֶל.לֳג.אֲג" oder
    • "פַּגֶל.לֳג.אֲג" oder
    • "פַּגֶל.לֳג.אַג"
  • "דר.פּגל.לג.אג. =: "dörr'pgl.log.ag"
  • "dr" wird vom Englischsprecher als "Doktor" erkannt und artikuliert.
    Das Melingo-Wörterbuch (Lit.2a) erkennt "dr." als Akronym (= "Abkürzung" (dts.), "abbreviation" (engl.) = "קיצור של" (isr.))
    für zwei Bedeutungen:
    • "Schuldner", "Debitor" (dts.; kaufm.Begriff) = "debtor" (engl.) = " בַּעַל חוֹב, לוֹוֶה"
    • "Drachme" (dts.; ehem. griech.Währung) = " דְּרַכְמָה"
    Zum Hauptwort "doctor" (engl.) kennt das Melingo-Wörterbuch ebenfalls zwei Bedeutungen:
    • 1. (Aussprache nach ReadIt: "dok'tór"): " דּוֹקְטוֹר"
      Und weil google mit der Suche nach diesen mit diakritischen Nikud-Vokalzeichen versehenen Buchstaben Probleme hat, hier noch mal die Schreibweise ohne Nikudim (Plural von Nikud): "דוקטור"
      Eine Wiktionary-Seite kennt hierzu ein Synonym:
      • (ohne Nikudim:) "רופא",
      • (mit Nikudim:) "רוֹפֵא"
      • romanisiert: "rofe"
      welches aber im Sinne von Doktor, Arzt zu verstehen ist, obwohl die ursprüngliche Bedeutung für "Doktor" nichts anderes als "Lehrer" ist. Leider habe ich ausser an der Universität und in Kliniken vortragenden Ärzten noch keinen Arzt gesehen, der seine Patienten belehrt.

      Eine andere Wiktionary-Seite verrät die hebräische Abkürzung für Dr.: "ד"ר"
      Also kann, wenn auch nur provisorisch, weil wegen fehlender hebräischer Laut- und Schriftzeichenkunde noch nicht die Auswirkungen beim vollständigen Weglassen der diakritischen Zeichen geklärt sind, der Weblog-Titel in hebräischen Buchstaben transSkribiert werden (teilweise mit Nikudim:):
      • dr.pagel.log.ag = ד"ר.פָּגֶל.לֳג.אג

    • 2. (Aussprache nach ReadIt ("th" wie in englisch "thread"): "thrár akadém"): "תואר אקדמי"
    • "d" =: #1491; = ד
    • "r" =: #1512; = ר
  • im HTML-Editor "NVU" wird nur der lateinschriftliche Text vorgelesen, da intern die hebräischen Zeichen als Unicode "#Zahl;" abgelegt sind
  • die Wörter auf der Browserseite "Firefox" bekommt man vorgesprochen, wenn man das Wort / den Buchstaben mit der Maus doppelt anklickt
  • im HTML-Editor von weblog.freenet.de wird jedes fertig getippte Wort laut vorgelesen (ReadIt-Grundeinstellung)
(dp) (+5,5h)

Nachtrag_2 am 31.8.2007 um 00.40Uhr:
Über den israelischen Suchbegriff für "Doktor", der ebenso (siehe oben) ausgesprochen wird, habe ich ein Spanisch-Hebräisches online-Wörterbuch "Mermaidel" mit romanisierter Lesehilfe entdeckt (s.Linksammler). Es gibt dazu auch eine Wörtersammlung "von Israelisch nach Spanisch", ebenfalls mit romanisierter Lesehilfe, die auch die Vokale auführt.

Linksammler:Gute Nacht! Buena noche! LAYLAH TOV! (laila'tóff) לַיְלָה טוֹב (dp) (+1,25h)

Nachtrag_3 am 26.9.2007 um 07.20Uhr:
Es ist vollbracht. Am letzten Tag der Gratis-Testmöglichkeit habe ich die ReadIt-Vorlesung meiner Vokabeln beenden können. Einige Vokabeln waren bisher noch nicht über google zu recherchieren. Die muss ich mir dann später noch persönlich zur Brust nehmen, wenn ich die Aussprache-Logik von Hebräisch-Texten besser verstanden habe. Bis zur Publikation meiner Vokabeln in einem separaten Beitrag kann es noch Wochen dauern, da ich diese alpabetisch sortieren und endlich verstehen möchte, wie man im Falle, die hebräische Schreibrichtung ist widererwarten von links nach rechts diese einfach umkehrt, ohne Buchstabe für Buchstabe diese Wörter wieder neu einzutippen. !tvren saD | Das nervt! . Hierzu ist das kürzlich zufällig entdeckte Attribut dir="rtl" (für "right-to-left" / von - rechts - nach - links - Schreibrichtung) oder dir="ltr" (für "left-2-right") ungeeignet oder nicht in allen HTML-Tags anwendbar. Ebenso ungeeignet ist das style-Attribut "direction; rtl;" oder "direction: ltr;". Lediglich die Anordnung der Tabellenspalten wird dadurch vertauscht, aber wer zerlegt schon gerne ein Wort in Einzelbuchstaben, um jeden Buchstaben in eine eigene Tabellenspalte zu stellen?

Dieses Problem ist inzwischen gelöst und damit folgender Fragesatz überholt: Vielleicht muss man sich hierfür ein Javascript-Programm schreiben, welches selbstständig das eingelesene Wort in Einzelbuchstaben zerlegt und anschließend in umgekehrter Reihenfolge wieder zusammensetzt und ausgibt? Vielleicht ist auch google in der Lage, die hebräischen Wörter in ltr (l2r)-Schrift zu suchen und das Ergebnis dann in richtiger Reihenfolge auszugeben?

Nach dem "uninstall readit"-Aufruf verbleibt eine Datei "hooks.dll" im Ordner "c:/Programme/LetsTalk/Read It". Jetzt werde ich erst mal den Rechner herunterfahren und vier Wochen Schlafdefizit nachholen.

Schließlich habe ich noch vor dem Deinstallieren eine Programm-Beschreibung als kennwort-verschlüsselte PDF-Datei entdeckt:
  • dessen Texte wären mit hebräischen Schriftzeichen zu lesen oder abzutippen, wenn man Hebräisch verstünde oder mit einer solchen Tastatur gesegnet wäre (in meiner Liste v.19.4.2007 fehlt noch Hebräisch !)
  • angeblich enthält sie Schriftzeichensätze von einer Webseite "anonymous.com", die ich auch noch nicht kenne.
  • das Herauskopieren einzelner Wörter, um sie z.B. mit Hilfe des UN-Tranlators übersetzen zu lassen, ist wegen der kennwort-Verschlüsselung sehr unpraktisch.

    Man kann ohne Kenntnis des KW's den Text lesbar machen. Hierzu legt man eine Codetabelle an und schreibt das Zeichen hinein, wie z.B. eine verschlüsselte PDF-Datei es einem sugeriert und daneben das Zeichen, wie man es aus der PDF-Datei herauskopieren kann. Hier am Beispiel kann man eine Methode der Textverschlüsselung lernen: es kann jede Schriftdarstellung (fett, normal, verkleinert, kursiv, farbig, ...) innerhalb des Dokumentes anders verschlüsselt sein, d.h. eine einmalige Entschlüsselung würde nie funktionieren. Vielleicht zerlegen Suchmaschinen auch deswegen alles in Miniaturschnipsel und verschlüsseln jeden Schnipsel anders.
Wenn man viel Zeit gehabt hätte, dann hätte man in den 30 Testtagen den hebräischen Text aus der Gebrauchsanweisung abtippen und sich übersetzen lassen können. Aber wer hat hierfür Zeit?

Vokabelsammlung fürs Verständnis dieser PDF-Datei

Ob die LetsTalk-Programm-Macher nicht auf die Idee gekommen sind, dass es für ihr Programm ReadIt noch außerisraelische Kunden gäbe, wenn wenigstens (englischsprachige) PDF-Datei oder englischsprachige Passagen zum Programmpaket gehören würden, damit man leichter versteht, wie es funktioniert. Ist es vielleicht nicht gewollt, dass ausserisraelische Kunden Hebräisch lernen?

So mit schnellem Blick ist mir keine Preisvorstellung zum Gebrauch von ReadIt aufgefallen, es sei denn die Zahlen seien auf hebräische Art mit Hilfe hebräischer Buchstaben verschlüsselt. Vielleicht ist der Preis auch Verhandlungssache, wenn man bei der LetsTalk-Firma anruft. Na, ich bin mal auf die nächste Telefonrechnung gespannt. (dp) (+2h)

========unerledigt:======= hierzu später etwas:
http://www.freenet-business.de/

Fortsetzung folgt
archiviert (tbid1557.299): (dp) 23.04.2009 (+0,2h (+flagcounter +home.icon +w3c_LiCh +4navi +link-korr.)), 02.06.2009 (+0,2h (link-korr.))
Haftungsausschluss
free counters
© drpagel.de Alle Rechte vorbehalten.