字符编码

字符编码

术语字符编码(character encoding),字符映射(character map),字符集(character set)或者代码页,在历史上往往是同义概念,即字符表(repertoire)中的字符如何编码为码元的流(stream of code units)–通常每个字符对应单个码元。

码元(Code Unit,也称「代码单元」)是指一个已编码的文本中具有最短的比特组合的单元。对于UTF-8来说,码元是8比特长;对于UTF-16来说,码元是16比特长;对于UTF-32来说,码元是32比特长[1]。码值(Code Value)是过时的用法。

代码页通常意味着面向字节的编码,但强调是一套用于不能语言的编码方案的集合.著名的如"Windows"代码页系列,"IBM"/"DOS"代码页系列.

IBM的字符数据表示体系(Character Data Representation Architecture - CDRA)与编码字符集标识符(coded character set identifiers - CCSIDs) 常常把charset, character set, code page, or CHARMAP等类似意义的术语混用.

Unix或Linux不使用代码页概念,它们用charmap,比locales具有更广泛的含义.

与上文的编码字符集(Coded Character Set - CCS)不同,字符编码(character encoding)是从抽象字符到代码字(code word)的映射. HTTP(与MIME)的用法中,字符集(character set)与字符编码同义,但与CCS不是一个意思.

相关推荐

世界杯直播
Bet体育365第二次提款要多久

世界杯直播

📅 07-10 👁️ 2052
双十一根本不知道啥便宜,消费者:钱没省多少买了一堆用不上的
鑫谷光韵HALO侧透版黑色
Bet体育365第二次提款要多久

鑫谷光韵HALO侧透版黑色

📅 07-23 👁️ 7180
2026美加墨世界杯亚洲预选赛 日本VS沙特阿拉伯 集锦
Bet体育365第二次提款要多久

2026美加墨世界杯亚洲预选赛 日本VS沙特阿拉伯 集锦

📅 08-03 👁️ 9505
船用起重机承重能力如何?能否满足大型货物需求?
mobile365体育投注官网

船用起重机承重能力如何?能否满足大型货物需求?

📅 07-15 👁️ 406
时间的成语
365bet手机版下载

时间的成语

📅 07-09 👁️ 9123
好会花审核一般多久
mobile365体育投注官网

好会花审核一般多久

📅 07-10 👁️ 1410
C++primer需要多久才能看完
mobile365体育投注官网

C++primer需要多久才能看完

📅 07-23 👁️ 2890
青青稞酒:中国青稞酒之源 高海拔、高寒、无污染,使青稞比其它粮食作物具有特殊的营养价值,也造就了独特的青稞文化。追溯青藏的酿酒历史,有4200年的...