Die folgende Tabelle enthält den Teil eines Zeichensatzes, der die Thai-Zeichen enthält. Die Nummerierung der Zeilen und Spalten bezieht sich auf einen Nicht-Unicode-Zeichensatz, bei dem die Zeichen in der oberen Hälfte des 1-Byte-ASCII-Codes untergebracht sind. Die Adresse eines Zeichens (und damit den Code) kann man ermitteln, indem Zeilen- und Spaltenwert addiert werden.

Das Zeichen GO GAI hat demnach den Wert 161 in der Codetabelle, wie Sie leicht nachrechnen können.

Heutzutage hat sich allerdings der sog. Unicode durchgesetzt, der Zeichen mit mehr als 8 Bit beschreibt und daher fast unbeschränkt viele Zeichen für alle Sprachen dieser Welt zur Verfügung stellt. Für ein Unicode-Zeichen wird dem ASCII-Code der konstante Wert 3424 hinzuaddiert.

Auffällig ist, dass Tonzeichen und einige Vokale mehrfach in der Tabelle enthalten sind. Warum? Sie liegen in unterschiedlichen Höhen im Zeichensatz, so dass ein entsprechend ausgerüstetes Schreib-Programm Zeichen genauer zusammen setzen kann. Beispiel:

 

Ein Konsonant ohne Vokal, aber mit Tonzeichen wird normalerweise so geschrieben: Zumindest erzeugt die Tastatur standardmäßig die Codes dafür. Ein intelligentes Programm könnte jedoch erkennen, dass der für einen eventuellen Vokal reservierte Platz in diesem Fall nicht notwendig ist und für die Anzeige und den Druck das Tonzeichen durch ein tiefer liegendes ersetzen und daraus machen. Sieht doch besser aus!

Die Ersetzung darf jedoch nicht stattfinden, wenn ein Vokal über dem Konsonanten steht: und nicht so .

Das Ersetzen durch alternativ vorhandene Codes sollten wir allerdings dem verwendeten Programm überlassen. Das nämlich ersetzt nur für die Anzeige und lässt den gespeicherten Code unverändert, so dass andere Programme auch damit fehlerfrei arbeiten können. Also: keineswegs die alternativen Zeichen selbst eintippen.

 

 

 

Thai-Zeichensatz
Computer arbeiten mit Codes für einzelne Schriftzeichen. Dafür wurde früher ausschließlich der sog. ASCII-Code verwendet, der mit 8 Bit 256 verschiedene Zeichen kodieren kann. In der ersten Hälfte sind die romanische Zeichen enthalten, die es in allen Sprachen gibt. In der zweiten Hälfte sind in der Standardtabelle solche Zeichen, die in verschiedenen Sprachen benötigt werden. Für Thai ist dieser ganze Bereich mit Thai-Zeichen gefüllt. Diese Version der ASCII-Tabelle ist nach TIS-620 genormt.
Werbung:
Werbung: