Encodage du texte (charset)

Février 2011


Précédent

Table des matières

Suivant


Qu'est ce que l'encodage des caractères ? (et en quoi cela me regarde ?)

De façon simplifiée : à la base, les ordinateurs comprennent des opérations booléennes et arithmétiques, mais sont incapables de comprendre du texte.
Aussi bizarre que cela puisse paraître, une table des correspondances est nécessaire afin de traduire le langage machine (binaire) en langage humainement compréhensible. Cette table de correspondance est plus connue sous le nom de Charset Encoding en anglais.

Combien d'alphabets différents est utilisé dans le monde ? des tonnes et des tonnes ... Latin, Grec, Hebreux, Arabe, Chinois, Japonnais et bien d'autres... et par suite, des tonnes et des tonnes de Charset Encodings différents ont été définis pendant des années.

SQLite/SpatiaLite utilise par défaut l'encodage UTF-8 , qui est universel : malheureusement, Shapefiles (et d'autres formats de données, tels les fichiers SVC/TXT) ne sont pas basés sur UTF-8  (des encodages nationaux sont utilisés), ainsi vous devez indiquer à SpatiaLite l'encodage à utiliser à chaque import/export de données. C'est la triste réalité

Quoi qu'il en soit, ne considérez pas cela comme une complication, mais comme une importante ressource : de cette manière vous pourrez importer/exporter n'importe quel jeu de donnée provenant d'encodages aussi divers que variés.
Et après tout, être capable d'afficher du texte avec plusieurs alphabets impressionnera certainement vos amis ! regardez : Roma,??µ?,???,??


Quelques références :


Précédent

Table des matières

Suivant


Author: Alessandro Furieri a.furieri@lqt.it
Traduced from English by RIVIERE Romain

This work is licensed under the Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) license.


Permission is granted to copy, distribute and/or modify this document under the terms of the
GNU Free Documentation License, Version 1.3 or any later version published by the Free Software Foundation;
with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts.