AddressDoctor
Software








Character Set Mapping und Transliteration

Die CSMT Komponente ist eine unverzichtbare Hilfe bei der Arbeit mit Zeichenketten (Strings) in nahezu allen gängigen Zeichensätzen. Die Komponente basiert auf Unicode und stellt in den COM, C++ und Java Varianten alle wichtigen Funktionen einer modernen String Klasse bereit. Sie ist in der Lage, 40 verschiedene Zeichensätze ineinander zu überführen und nicht lateinische Schriftzeichen durch Transliteration in lateinische Schriftzeichen zu überführen.

  • Mapping zwischen über 40 verschiedenen Zeichensätzen, unter anderem UTF-8, ISO 8859-1, GBK, BIG5, JIS, EBCDIC
  • Zeichenfilterung auf 'a'-'Z' und '0' - '9'
  • Korrekte “Beseitigung” von Umlauten und Sonderzeichen gemäß den sprachspezifischen Regeln
  • HTML und URL Encoding und Decoding
  • Unix <-> Windows Zeilenumbruch (Linefeed) Konvertierungen
  • Griechische Transliteration (BGN/PCGN 1962, ISO 843 – 1997)
  • Kyrillische Transliteration (BGN/PCGN 1947, ISO 9 – 1995)
  • Hebräische Transliteration
  • Japanische Katakana, Hiragana und Kanji Transliteration
  • Chinesische Pinyin Transliteration (Mandarin, Kantonesisch)
  • Koreanische Hangul Transliteration
CSMT
Beispielanwendung, die mit Hilfe der CSMT Komponente geschrieben wurde.

Data Quality Center

Account ID
Kennwort

Kennwort vergessen?
Kein Konto? Kostenlos anmelden.

Schnellzugriff

 Dreieck Bestellungen und Preise
 Dreieck Postleitzahlensuche
 Dreieck Länderabdeckung
 Dreieck Demos
 Dreieck Referenzen
 Dreieck Broschüre bestellen
 Dreieck Persönlicher Kontakt

 Dreieck RSS Feeds RSS