DrPagel-FavIcon
« »

Verfasst am 17.06.2006 14:57:57 Uhr
Weblogs von freenet und beepworld anhand von ArmSCII-8 und UniCode in einer Tabelle

Habe lange nach einer Übersetzung des Begriffes Ascorbinsäure ins Armenische gesucht und bin endlich im Englisch-Armenischen Fachwörterbuch für Medizinische Begriffe (inexist.Link im April2009 deaktiviert) fündig geworden (s.Tabelle»). Hatte bereits vor 4 bis 5 Monaten danach geforscht.

Was mir an den Eingabemasken von beeplog als auch freenet missfällt, ist, dass es selbstherrlich diverse SprachSchriftcode-Einstellungen verstellt. So konnte während der Testphase
  • unter beeplog die Spalte mit den UniCode-Worten nur mit der Browsereinstellung ArmSCII-8 gelesen werden, auch meine deutschen Schriftumlaute ä, ö, ü und die Satzzeichen Klammer und Punkt waren unleserlich geworden! Die Erfahrung zeigt, dass man bei beeplog (vielleicht auch bei freenet?) während Eintrag-bearbeiten-Sitzung auch zu Testzwecken keine Schriftcodeeinstellungen des Browsers verändern darf. Zur Vermeidung zukünftiger Pannen muss man sich abmelden, dann die Browser-Schriftcodeeinstellung ändern um zu sehen ob die Schriftzeichen richtig wiedergegeben werden und sich gegebenenfalls zum Ändern der Einträge wieder anmelden. Nun muss(te) ich mühsam aus meiner UniCode-Textdatei den Code wieder einbauen.
Wenn man weiß wozu, dann kann man diese selbstherrliche Sprachschriftcode-Veränderung auch nutzen:
  • das beeplog-Programm setzt den gewöhnichen ArmSCII-8-Code nach dem Anklicken von "Veröffentlichen" in den HTML-Entitie-Code um, der robust gegenüber den µsoft Schriftarteinstellungen ist und meine pinkfarben hinterlegten Zeichenketten von Spalte 3 ergibt. Daher ist es mir über verschiedene Schriftcode-Einstellungen bisher nicht gelungen, in Spalte 3 meiner von freenet nach beepworld kopierten Fassung je nach Schriftcode armenische Zeichen hervorzuzaubern. Lediglich die UniCode-Zeichen in Spalte 4 werden nicht in Entitie-Zeichen transformiert und sind dort als armenische Schriftzeichen erkennbar (Vorteil vom freenet-Weblog!).
  • das freenet-Weblog-Programm hingegen macht genau das Gegenteil und wandelt die HTML-Entities in µsoft-kompatiblen 256-Zeichen-Zeichensatzcode um, der bei jeder Schriftarteinstellung des Browsers anders dargestellt werden kann (ich vermute, freenet arbeitet mit einem Steuerprogramm oder Server-Betriebssystem von µsoft). Mit dieser Methode kann man nach Wahl der richtigen Schriftart (falls sie bereits vorhanden ist) z.B. die armenischen Schriftzeichen sichtbar machen und diese aus dem Browserfenster des publizierten Eintrages herauskopieren und unter der Einträge-Bearbeiten-Seite in die Eingabemaske für den UniCode (hier Spalte 4) hineinkopieren.
  • damit der Nutzen auch von Dauer ist, muss der fertige Weblog-Beitrag von freenet z.B. in einer wordpad-Datei unbedingt als UniCode-Textdatei abgespeichert werden, auch wenn µsoft seine Warntafel hochhält. Das Abspeichern unter einer Word6-Datei erhält zwar die µsoft favorisierten Daten der hier unnötigen Formate und mehr, aber die UniCode-Information ist zerstört und wird nachfolgend nur als Fragezeichen angezeigt.
Ein weiterer Vergleich zeigt,
  • bei freenet ist das Entfernen der vielen Zeilenvorschubzeichen in der Tabelle nötig und macht mir sehr viel Mühe!
  • bei beeplog ist das Entfernen der vielen Zeilenvorschubzeichen in der Tabelle unnötig, ja sogar ein Vorteil von beeplog kommt zum Vorschein: falls ein unvollständiger oder unkorrekter HTML-Code eingegeben wurde, wird er analog zum HTML-Editor unter Mozilla korrigiert, was einem viel Entwickler-Denkarbeit abnimmt.
Ein weiterer Vergleich zeigt,
  • bei freenet kann eine Leerzeile im Editor-Quellcode automatisch als ein <br /><br /> bzw. <br class="trenner"> interpretiert werden und ein Zeilenumbruch mit Leerzeile ist die Folge
  • bei beeplog muss man unterscheiden:
    • im normalen (voreingestellten) Texteditor wird die Leerzeile ebenfalls als solche interpretiert und dargestellt
    • im Editor für Quellcode hineinkopiert wird die Leerzeile ignoriert und der Text wird zusammenhängend ohne Zeilenumbruch publiziert. Eine erneutes Öffnen des Quellcode-Editors zeigt, dass auch dieser Quellcode automanipuliert und die Leerzeile durch ein Leerzeichen ersetzt worden ist.
1: deutsch (German)
2: englisch (English)
armenisch
3a:non-ArmSCII-8 Code (HTML-Entity)
3b:ArmSCII-8 Code (z.B.: Arial AM, Courier AM)
armenisch
4: ISO-8859
Font: UniCODE
a: als Text
b: als Bild
armenisch
5: Transliteration (Lateinschrift)
1:Ascorbat-Oxidase
2:ASCORBATE OXIDASE
3a:²êÎàð´²îúøêƸ²¼
3b:²êÎàð´²îúøêƸ²¼
4a:ԱՍԿՈՐԲԱՏՕՔՍԻԴԱԶ
4b:ARM01.JPG
5:
1:Ascorbinsäure
2:ASCORBIC ACID
3a:²êβð´ÆÜ²ÂÂàô
3b:²êβð´ÆÜ²ÂÂàô
4a:ԱՍԿԱՐԲԻՆԱԹԹՈՒ (Tippfehler?)
4b:ARM02A.JPG
4a:ԱՍԿՈՐԲԻՆԱԹԹՈՒ (korrekt?)
4b:ARM02B.JPG
5:
1:Dehydroascorbatase
2:DEHYDROASCORBATASE
3a:¸ºÐƸðà²êÎàð´²î²¼
3b:¸ºÐƸðà²êÎàð´²î²¼
4a:ԴԵՀԻԴՐՈԱՍԿՈՐԲԱՏԱԶ
4b:ARM03.JPG
5:
1:Dehydroascorbinsäure
2:DEHYDROASCORBIC ACID
3a:¸ºÐƸðà²êÎàð´ÆÜ²ÚÆÜ ÂÂàô
3b:¸ºÐƸðà²êÎàð´ÆÜ²ÚÆÜ ÂÂàô
4a:ԴԵՀԻԴՐՈԱՍԿՈՐԲԻՆԱՅԻՆ ԹԹՈՒ
4b:ARM04.JPG
5:
1:Essigsäuren
2:ACETIC ACIDS
3a:ø²ò²Ê²ÂÂàôܺð
3b:ø²ò²Ê²ÂÂàôܺð
4a:ՔԱՑԱԽԱԹԹՈՒՆԵՐ
4b:ARM05.JPG
5:
1:Fettsäuren
2:FATTY ACIDS
3a:Ö²ðä²ÂÂàôܺð
3b:Ö²ðä²ÂÂàôܺð
4a:ՃԱՐՊԱԹԹՈՒՆԵՐ
4b:ARM06.JPG
5:
1:FlussSäure
2:HYDROFLUORIC ACID
3a:üîàð²æð²ÌÜ²ÚæÜ ÂÂàô
3b:üîàð²æð²ÌÜ²ÚÆÜ ÂÂàô
4a:ՖՏՈՐԱՋՐԱԾՆԱՅԻՆ ԹԹՈՒ
4b:ARM07.JPG
5:
1:Hydroxysäuren
2:HYDROXY ACIDS
3a:ÐÆ¸ðúøêÆÂÂàôܺð
3b:ÐÆ¸ðúøêÆÂÂàôܺð
4a:ՀԻԴՐՕՔՍԻԹԹՈՒՆԵՐ
4b:ARM08.JPG
5:
1:Lauge
2:LYE
3a:ØàÊð²æàôð
3b:ØàÊð²æàôð
4a:ՄՈԽՐԱՋՈՒՐ
4b:ARM09.JPG
5:
1:Natrium-Hydroxid
2:SODIUM HYDROXIDE
3a:ܲîðÆàôØÆ ÐÆ¸ðúøêƸ
3b:ܲîðÆàôØÆ ÐÆ¸ðúøêƸ
4a:ՆԱՏՐԻՈՒՄԻ ՀԻԴՐՕՔՍԻԴ
4b:ARM10.JPG
5:
1:Säure (sg.)
2:ACID (sg.)
3a:ÂÂàô
3b:ÂÂàô
4a:ԹԹՈՒ
4b:ARM11.JPG
5:
1:Säuren (pl.)
2:ACIDS (pl.)
3a:ÂÂàôܺð
3b:ÂÂàôܺð
4a:ԹԹՈՒՆԵՐ
4b:ARM12.JPG
5:
1:Salz (sg.)
2:SALT
3a:²Ô
3b:²Ô
4a:ԱՂ
4b:ARM13.JPG
5:
1:das Salz (sg.)
2:THE SALT
3a:²ÔÜ
3b:²ÔÜ
4a:ԱՂՆ
4b:ARM14.JPG
5:
1:Salze (pl.)
2:SALTS
3a:²Ôºð
3b:²Ôºð
4a:ԱՂԵՐ
4b:ARM15.JPG
5:
1:Salzdrüse
2:SALT GLAND
3a:²Ô²ÚÆÜ ¶ºÔÒ
3b:²Ô²ÚÆÜ ¶ºÔÒ
4a:ԱՂԱՅԻՆ ԳԵՂՁ
4b:ARM16.JPG
5:
1:Salzsäure
2:HYDROCHLORIC ACID
3a:²Ô²ÂÂàô
3b:²Ô²ÂÂàô
4a:ԱՂԱԹԹՈՒ
4b:ARM17.JPG
5:
1:Schwefelsäuren
2:SULFUR ACIDS
3a:êàôÈüàÂÂàôܺð
3b:êàôÈüàÂÂàôܺð
4a:ՍՈՒԼՖՈԹԹՈՒՆԵՐ
4b:ARM18.JPG
5:
  • Die armenischen und englischen Wörter wurden hier alle in Großbuchstaben (BLOCKBUCHSTABEN) aus der Datensammlung des Englisch-Armenischen Medizin-Fachwörterbuches der Armenischen Akademie der Wissenschaften übernommen.
    Wenn ich viel Zeit gehabt hätte, hätte ich hier die Wörter auch unter Berücksichtigung der Groß- und Kleinschreibung auflisten können. Für eine erfolgversprechende google-Suche ist die Schreibung in Grossbuchstaben ebenso wie in Kleinbuchstaben hinreichend.
  • Für Leser ohne installierten armenischen Browser-Schriftzeichensatz habe ich unter "4b" die Wörter als Bild ergänzt. Diese sind weder für die google-Suche geeignet, noch lassen sie sich in der Bildgröße variieren.
  • Nicht in jedem Fall wurde auf die korrekte Übersetzung des bestimmten Artikels geachtet. Der Artikelzusatz ist am Beispiel von "Salz, das Salz" zu erkennen. Möglicherweise wären einige Beispiel-Wörter unter Verwendung des bestimmten Artikels richtiger zu übersetzen, z.B. anstatt unbestimmt mit "...säure, ...säuren" mit "die ...säure, die ...säuren". Leider kenne ich mich zur Zeit hier nicht weiter aus.
  • Für Leser ohne ...
    • Vorkenntnisse der armenischen Schriftzeichen und ihrer Aussprache habe ich die SpaltenÜberschrift "Transliteration"...
    • sichere Kenntnisse von armenischen Groß- und Kleinbuchstaben habe ich die Spaltenüberschrift "UniCode"...
      ...in dieser Tabelle mit meinem Beitrag vom 25.3.2006 verlinkt.
  • Die Code-Konvertierung von ArmScii-8 nach UniCode oder von UniCode nach ArmScii-8 ist offline mit ArmUni.exe möglich.
  • unvollständige Tabellenfelder werden nach und nach ergänzt

Dies ist nur ein kleines Geschenk für die Menschheit, aber ein großes für mich! Danke der Armenischen Akademie der Wissenschaften. Ich bin gerührt...

WarnHinweis: Dieser Beitrag enthält nichtausführbaren HTML-Code (hier pinkfarben hinterlegt), indem nach jedem Aufruf vom freenet-Tagebuch-Menüpunkt "Einträge bearbeiten / Bearbeiten" die im Urtext verwendeten HTML-Entity-Wörter manuell wieder neu eingegeben werden müssen (äußerst lästig; das muss sich ändern!). Die Einkapselung des nichtausführbaren HTML-Codes zwischen <pre> und </pre> hilft auch nicht weiter und kostet nur viel Platz! (dp)

Nachtrag_1 am 18.04.2009 um 02.05Uhr:
Wie soeben ein Test gezeigt hat, können armenische Texte (wie die Vokabeln in obiger Tabelle), die mit Hilfe von "Arial AMU für Windows98" erstellt und publiziert worden sind, vom TrueTypeFont(TTF) ArianAMU (Arial Armenian für Windows XP) nicht gelesen werden. Schade! - Zum Glück ist aber das medizinische Wörterbuch "www.medlib.am/?page=dictionary" inzwischen auf Unicode (UTF-8) umgeschrieben worden, so dass man es sowohl auf Windows98se als auch WindowsXP lesen können sollte.

Möchte man diese auf UTF-8 neucodierten Wörterbuchseiten unter Staroffice lesen, dann jedoch ist ArianAMU eine wertvolle Hilfe und man kann sich die offline-Arbeit des Umcodierens sparen. Großes Lob! (dp) (1,5h)

Nachtrag_2 am 06.07.2009 um 12Uhr:
Soeben beim Archivieren habe ich festgestellt, dass sich eine ähnliche Tabelle und Text auf einer beeplog-Seite und nun auch noch hier im Tagebucharchiv unter http://tb-archiv.drpagel.de/TB_2006-06-18Beitrag2_beeplog.html befindet. Habe da gleich mal etwas aufgeräumt. Jedoch Vorsicht: die Tabelle vom TB-Archivbeitrag2 am 18.6.2006 ist die aktuellste Fassung. (dp)(1h)
archiviert (tbid737.132): (dp) 04.04.2009 (+0,1h (+flagcounter +home.icon +w3c_LiCh +4navi)), 17.4.2009 (+0,75h (+html-korr. +Link-Recherche +Link-korr.)),03.8.2010(+0,03h(-validome.org+w3c_HTMLch))
Haftungsausschluss
free counters
© drpagel.de Alle Rechte vorbehalten.