Verfasst
am 17.06.2006 14:57:57 UhrWeblogs von freenet und beepworld anhand von ArmSCII-8 und UniCode in einer TabelleHabe lange nach einer Übersetzung des Begriffes Ascorbinsäure ins Armenische gesucht und bin endlich im
Englisch-Armenischen Fachwörterbuch für Medizinische Begriffe (inexist.Link im April2009 deaktiviert) fündig geworden (s.
Tabelle»). Hatte bereits vor 4 bis 5 Monaten danach geforscht.
Was mir an den Eingabemasken von beeplog als auch freenet missfällt, ist, dass es selbstherrlich diverse SprachSchriftcode-Einstellungen verstellt. So konnte während der Testphase
- unter beeplog die Spalte mit den UniCode-Worten nur mit der Browsereinstellung ArmSCII-8 gelesen werden, auch meine deutschen Schriftumlaute ä, ö, ü und die Satzzeichen Klammer und Punkt waren unleserlich geworden! Die Erfahrung zeigt, dass man bei beeplog (vielleicht auch bei freenet?) während Eintrag-bearbeiten-Sitzung auch zu Testzwecken keine Schriftcodeeinstellungen des Browsers verändern darf. Zur Vermeidung zukünftiger Pannen muss man sich abmelden, dann die Browser-Schriftcodeeinstellung ändern um zu sehen ob die Schriftzeichen richtig wiedergegeben werden und sich gegebenenfalls zum Ändern der Einträge wieder anmelden. Nun muss(te) ich mühsam aus meiner UniCode-Textdatei den Code wieder einbauen.
Wenn man weiß wozu, dann kann man diese selbstherrliche Sprachschriftcode-Veränderung auch nutzen:
- das beeplog-Programm setzt den gewöhnichen ArmSCII-8-Code nach dem Anklicken von "Veröffentlichen" in den HTML-Entitie-Code um, der robust gegenüber den µsoft Schriftarteinstellungen ist und meine pinkfarben hinterlegten Zeichenketten von Spalte 3 ergibt. Daher ist es mir über verschiedene Schriftcode-Einstellungen bisher nicht gelungen, in Spalte 3 meiner von freenet nach beepworld kopierten Fassung je nach Schriftcode armenische Zeichen hervorzuzaubern. Lediglich die UniCode-Zeichen in Spalte 4 werden nicht in Entitie-Zeichen transformiert und sind dort als armenische Schriftzeichen erkennbar (Vorteil vom freenet-Weblog!).
- das freenet-Weblog-Programm hingegen macht genau das Gegenteil und wandelt die HTML-Entities in µsoft-kompatiblen 256-Zeichen-Zeichensatzcode um, der bei jeder Schriftarteinstellung des Browsers anders dargestellt werden kann (ich vermute, freenet arbeitet mit einem Steuerprogramm oder Server-Betriebssystem von µsoft). Mit dieser Methode kann man nach Wahl der richtigen Schriftart (falls sie bereits vorhanden ist) z.B. die armenischen Schriftzeichen sichtbar machen und diese aus dem Browserfenster des publizierten Eintrages herauskopieren und unter der Einträge-Bearbeiten-Seite in die Eingabemaske für den UniCode (hier Spalte 4) hineinkopieren.
- damit der Nutzen auch von Dauer ist, muss der fertige Weblog-Beitrag von freenet z.B. in einer wordpad-Datei unbedingt als UniCode-Textdatei abgespeichert werden, auch wenn µsoft seine Warntafel hochhält. Das Abspeichern unter einer Word6-Datei erhält zwar die µsoft favorisierten Daten der hier unnötigen Formate und mehr, aber die UniCode-Information ist zerstört und wird nachfolgend nur als Fragezeichen angezeigt.
Ein weiterer Vergleich zeigt,
- bei freenet ist das Entfernen der vielen Zeilenvorschubzeichen in der Tabelle nötig und macht mir sehr viel Mühe!
- bei beeplog ist das Entfernen der vielen Zeilenvorschubzeichen in der Tabelle unnötig, ja sogar ein Vorteil von beeplog kommt zum Vorschein: falls ein unvollständiger oder unkorrekter HTML-Code eingegeben wurde, wird er analog zum HTML-Editor unter Mozilla korrigiert, was einem viel Entwickler-Denkarbeit abnimmt.
Ein weiterer Vergleich zeigt,
- bei freenet kann eine Leerzeile im Editor-Quellcode automatisch als ein <br /><br /> bzw. <br class="trenner"> interpretiert werden und ein Zeilenumbruch mit Leerzeile ist die Folge
- bei beeplog muss man unterscheiden:
- im normalen (voreingestellten) Texteditor wird die Leerzeile ebenfalls als solche interpretiert und dargestellt
- im Editor für Quellcode hineinkopiert wird die Leerzeile ignoriert und der Text wird zusammenhängend ohne Zeilenumbruch publiziert. Eine erneutes Öffnen des Quellcode-Editors zeigt, dass auch dieser Quellcode automanipuliert und die Leerzeile durch ein Leerzeichen ersetzt worden ist.
1: deutsch (German) 2: englisch (English) | armenisch 3a:non-ArmSCII-8 Code (HTML-Entity) 3b:ArmSCII-8 Code (z.B.: Arial AM, Courier AM) | armenisch 4: ISO-8859 Font: UniCODE a: als Text b: als Bild | armenisch 5: Transliteration (Lateinschrift) |
|---|
1:Ascorbat-Oxidase 2:ASCORBATE OXIDASE | 3a:²êÎàð´²îúøêƸ²¼ 3b:²êÎàð´²îúøêƸ²¼ | 4a:ԱՍԿՈՐԲԱՏՕՔՍԻԴԱԶ 4b: | 5: |
1:Ascorbinsäure 2:ASCORBIC ACID | 3a:²êβð´ÆÜ²ÂÂàô 3b:²êβð´ÆÜ²ÂÂàô | 4a:ԱՍԿԱՐԲԻՆԱԹԹՈՒ (Tippfehler?) 4b: 4a:ԱՍԿՈՐԲԻՆԱԹԹՈՒ (korrekt?) 4b: | 5: |
1:Dehydroascorbatase 2:DEHYDROASCORBATASE | 3a:¸ºÐƸðà²êÎàð´²î²¼ 3b:¸ºÐƸðà²êÎàð´²î²¼ | 4a:ԴԵՀԻԴՐՈԱՍԿՈՐԲԱՏԱԶ 4b: | 5: |
1:Dehydroascorbinsäure 2:DEHYDROASCORBIC ACID | 3a:¸ºÐƸðà²êÎàð´ÆÜ²ÚÆÜ ÂÂàô 3b:¸ºÐƸðà²êÎàð´ÆÜ²ÚÆÜ ÂÂàô | 4a:ԴԵՀԻԴՐՈԱՍԿՈՐԲԻՆԱՅԻՆ ԹԹՈՒ 4b: | 5: |
1:Essigsäuren 2:ACETIC ACIDS | 3a:ø²ò²Ê²ÂÂàôܺð 3b:ø²ò²Ê²ÂÂàôܺð | 4a:ՔԱՑԱԽԱԹԹՈՒՆԵՐ 4b: | 5: |
1:Fettsäuren 2:FATTY ACIDS | 3a:Ö²ðä²ÂÂàôܺð 3b:Ö²ðä²ÂÂàôܺð | 4a:ՃԱՐՊԱԹԹՈՒՆԵՐ 4b: | 5: |
1:FlussSäure 2:HYDROFLUORIC ACID | 3a:üîàð²æð²ÌÜ²ÚæÜ ÂÂàô 3b:üîàð²æð²ÌÜ²ÚÆÜ ÂÂàô | 4a:ՖՏՈՐԱՋՐԱԾՆԱՅԻՆ ԹԹՈՒ 4b: | 5: |
1:Hydroxysäuren 2:HYDROXY ACIDS | 3a:ÐÆ¸ðúøêÆÂÂàôܺð 3b:ÐÆ¸ðúøêÆÂÂàôܺð | 4a:ՀԻԴՐՕՔՍԻԹԹՈՒՆԵՐ 4b: | 5: |
1:Lauge 2:LYE | 3a:ØàÊð²æàôð 3b:ØàÊð²æàôð | 4a:ՄՈԽՐԱՋՈՒՐ 4b: | 5: |
1:Natrium-Hydroxid 2:SODIUM HYDROXIDE | 3a:ܲîðÆàôØÆ ÐÆ¸ðúøêƸ 3b:ܲîðÆàôØÆ ÐÆ¸ðúøêƸ | 4a:ՆԱՏՐԻՈՒՄԻ ՀԻԴՐՕՔՍԻԴ 4b: | 5: |
1:Säure (sg.) 2:ACID (sg.) | 3a:ÂÂàô 3b:ÂÂàô | 4a:ԹԹՈՒ 4b: | 5: |
1:Säuren (pl.) 2:ACIDS (pl.) | 3a:ÂÂàôܺð 3b:ÂÂàôܺð | 4a:ԹԹՈՒՆԵՐ 4b: | 5: |
1:Salz (sg.) 2:SALT | 3a:²Ô 3b:²Ô | 4a:ԱՂ 4b: | 5: |
1:das Salz (sg.) 2:THE SALT | 3a:²ÔÜ 3b:²ÔÜ | 4a:ԱՂՆ 4b: | 5: |
1:Salze (pl.) 2:SALTS | 3a:²Ôºð 3b:²Ôºð | 4a:ԱՂԵՐ 4b: | 5: |
1:Salzdrüse 2:SALT GLAND | 3a:²Ô²ÚÆÜ ¶ºÔÒ 3b:²Ô²ÚÆÜ ¶ºÔÒ | 4a:ԱՂԱՅԻՆ ԳԵՂՁ 4b: | 5: |
1:Salzsäure 2:HYDROCHLORIC ACID | 3a:²Ô²ÂÂàô 3b:²Ô²ÂÂàô | 4a:ԱՂԱԹԹՈՒ 4b: | 5: |
1:Schwefelsäuren 2:SULFUR ACIDS | 3a:êàôÈüàÂÂàôܺð 3b:êàôÈüàÂÂàôܺð | 4a:ՍՈՒԼՖՈԹԹՈՒՆԵՐ 4b: | 5: |
- Die armenischen und englischen Wörter wurden hier alle in Großbuchstaben (BLOCKBUCHSTABEN) aus der Datensammlung des Englisch-Armenischen Medizin-Fachwörterbuches der Armenischen Akademie der Wissenschaften übernommen.
Wenn ich viel Zeit gehabt hätte, hätte ich hier die Wörter auch unter Berücksichtigung der Groß- und Kleinschreibung auflisten können. Für eine erfolgversprechende google-Suche ist die Schreibung in Grossbuchstaben ebenso wie in Kleinbuchstaben hinreichend.
- Für Leser ohne installierten armenischen Browser-Schriftzeichensatz habe ich unter "4b" die Wörter als Bild ergänzt. Diese sind weder für die google-Suche geeignet, noch lassen sie sich in der Bildgröße variieren.
- Nicht in jedem Fall wurde auf die korrekte Übersetzung des bestimmten Artikels geachtet. Der Artikelzusatz ist am Beispiel von "Salz, das Salz" zu erkennen. Möglicherweise wären einige Beispiel-Wörter unter Verwendung des bestimmten Artikels richtiger zu übersetzen, z.B. anstatt unbestimmt mit "...säure, ...säuren" mit "die ...säure, die ...säuren". Leider kenne ich mich zur Zeit hier nicht weiter aus.
- Für Leser ohne ...
- Vorkenntnisse der armenischen Schriftzeichen und ihrer Aussprache habe ich die SpaltenÜberschrift "Transliteration"...
- sichere Kenntnisse von armenischen Groß- und Kleinbuchstaben habe ich die Spaltenüberschrift "UniCode"...
...in dieser Tabelle mit meinem Beitrag vom 25.3.2006 verlinkt.
- Die Code-Konvertierung von ArmScii-8 nach UniCode oder von UniCode nach ArmScii-8 ist offline mit ArmUni.exe möglich.
- unvollständige Tabellenfelder werden nach und nach ergänzt
Dies ist nur ein kleines Geschenk für die Menschheit, aber ein großes für mich! Danke der
Armenischen Akademie der Wissenschaften. Ich bin gerührt...
WarnHinweis: Dieser Beitrag enthält nichtausführbaren HTML-Code (hier pinkfarben hinterlegt), indem nach jedem Aufruf vom freenet-Tagebuch-Menüpunkt "Einträge bearbeiten / Bearbeiten" die im Urtext verwendeten HTML-Entity-Wörter manuell wieder neu eingegeben werden müssen (äußerst lästig; das muss sich ändern!). Die Einkapselung des nichtausführbaren HTML-Codes zwischen <pre> und </pre> hilft auch nicht weiter und kostet nur viel Platz! (dp)
Nachtrag_1 am 18.04.2009 um 02.05Uhr:Wie soeben ein Test gezeigt hat, können armenische Texte (wie die Vokabeln in obiger Tabelle), die mit Hilfe von "Arial AMU für Windows98" erstellt und publiziert worden sind, vom TrueTypeFont(TTF)
ArianAMU (Arial Armenian für Windows XP) nicht gelesen werden. Schade! - Zum Glück ist aber das medizinische Wörterbuch "www.medlib.am/?page=dictionary" inzwischen auf Unicode (UTF-8) umgeschrieben worden, so dass man es sowohl auf Windows98se als auch WindowsXP lesen können sollte.
Möchte man diese auf UTF-8 neucodierten Wörterbuchseiten unter Staroffice lesen, dann jedoch ist ArianAMU eine wertvolle Hilfe und man kann sich die offline-Arbeit des Umcodierens sparen. Großes Lob! (dp) (1,5h)
Nachtrag_2 am 06.07.2009 um 12Uhr:Soeben beim Archivieren habe ich festgestellt, dass sich eine ähnliche Tabelle und Text auf einer beeplog-Seite und nun auch noch hier im Tagebucharchiv unter
http://tb-archiv.drpagel.de/TB_2006-06-18Beitrag2_beeplog.html befindet. Habe da gleich mal etwas aufgeräumt. Jedoch Vorsicht: die Tabelle vom TB-Archivbeitrag2 am 18.6.2006 ist die aktuellste Fassung. (dp)(1h)
archiviert (tbid737.132): (dp) 04.04.2009 (+0,1h (+flagcounter +home.icon +w3c_LiCh +4navi)), 17.4.2009 (+0,75h (+html-korr. +Link-Recherche +Link-korr.)),03.8.2010(+0,03h(-validome.org+w3c_HTMLch))