Donnerstag, 8. Mai 2008

Codepages und DIN 66003

Es gibt Dinge, die wollte ich nie wissen und habe es tunlichst vermieden mich damit auseinanderzusetzen, jetzt hat mich das dank der Anbindung an verschiedene UNIX Systeme doch wieder eingeholt: Zeichsatzcodierungen.

Mit Hilfe von BizTalk werden verschiedene Quellen ausgelesen, die UNIX-typisch jeweils anders codiert sind. Sehr geholfen hat mir http://msdn.microsoft.com/en-us/library/ms776446(VS.85).aspx, jedoch ist das auch hier nicht ganz ohne Fallstricke ausgegangen:
IBM 437 = 437, ISO 8859-1 = 28591, ISO 8859-15 = 28605, und DIN 66003?

urks, steht nicht drin, ist ja auch klar. Die Recherche ergab ziemlich schnell, dass dahinter ISO 646 in der deutschen Ausprägung steht (021, bzw. DE, je nach Bezeichnungsvariante), was nichts anderes als ASCII 7bit für Deutschland darstellt... tzia nur das findet man immer noch nicht in dem obigen MSDN Link. Erst weitere Nachforschungen haben eine Implementation der ISO 646 nach IA5 zu Tage gefördert, BINGO! Da gibts tatsächlich was dazu unter der MSDN:

DIN 66003 = 20106

Letztendlich wird mir wieder klar, warum ich diese Zeichensatzcodierungen nie ausstehen konnte, die blanke Flut an Bezeichnern für ein und dasselbe sind schon ziemliche irre für sich allein genommen...

Ich hab aber auch eine Serie :-/

Keine Kommentare: