Qu'est ce que l'encodage des caractères ?
(et en quoi cela me regarde ?)
De façon simplifiée : à la base,
les ordinateurs comprennent des opérations booléennes et
arithmétiques, mais sont incapables de comprendre du texte. Aussi
bizarre que cela puisse paraître, une table des
correspondances est nécessaire afin de traduire le
langage machine (binaire) en langage humainement compréhensible.
Cette table de correspondance est plus connue sous le nom de
Charset Encoding en anglais.
Combien
d'alphabets différents est utilisé dans le monde ? des tonnes et
des tonnes ... Latin, Grec, Hebreux, Arabe, Chinois, Japonnais
et bien d'autres... et par suite, des tonnes et des tonnes de
Charset Encodings différents ont été définis pendant des
années.
SQLite/SpatiaLite utilise par défaut l'encodage
UTF-8 , qui est universel : malheureusement,
Shapefiles (et d'autres formats de données, tels les
fichiers SVC/TXT) ne sont pas basés sur UTF-8 (des
encodages nationaux sont utilisés), ainsi vous devez indiquer à
SpatiaLite l'encodage à utiliser à chaque import/export de
données. C'est la triste réalité
Quoi qu'il en soit, ne
considérez pas cela comme une complication, mais comme une
importante ressource : de cette manière vous pourrez
importer/exporter n'importe quel jeu de donnée provenant
d'encodages aussi divers que variés. Et après tout, être
capable d'afficher du texte avec plusieurs alphabets
impressionnera certainement vos amis ! regardez : Roma,??µ?,???,??
Quelques références :
|