Character Set Mapping und Transliteration
Die CSMT Komponente ist eine unverzichtbare Hilfe bei der Arbeit mit Zeichenketten (Strings) in nahezu allen
gängigen Zeichensätzen. Die Komponente basiert auf Unicode und stellt in den COM, C++ und Java
Varianten alle wichtigen Funktionen einer modernen String Klasse bereit. Sie ist in der Lage, 40 verschiedene
Zeichensätze ineinander zu überführen und nicht lateinische Schriftzeichen durch Transliteration
in lateinische Schriftzeichen zu überführen.
- Mapping zwischen über 40 verschiedenen Zeichensätzen, unter anderem UTF-8, ISO 8859-1, GBK, BIG5, JIS, EBCDIC
- Zeichenfilterung auf 'a'-'Z' und '0' - '9'
- Korrekte “Beseitigung” von Umlauten und Sonderzeichen gemäß den sprachspezifischen Regeln
- HTML und URL Encoding und Decoding
- Unix <-> Windows Zeilenumbruch (Linefeed) Konvertierungen
- Griechische Transliteration (BGN/PCGN 1962, ISO 843 – 1997)
- Kyrillische Transliteration (BGN/PCGN 1947, ISO 9 – 1995)
- Hebräische Transliteration
- Japanische Katakana, Hiragana und Kanji Transliteration
- Chinesische Pinyin Transliteration (Mandarin, Kantonesisch)
Koreanische Hangul Transliteration

Beispielanwendung, die mit Hilfe der CSMT Komponente geschrieben wurde.
|