我们都知道,在浏览器需要知道使用哪一种字符集才可以正确地显示HTML的页面。万维网在早期使用的字符集是ASCII,而ASCII支持0到9的数字,大写以及小写的英文字母表,还有一些特殊的字符。但是,因为很多国家使用的字符并不属于ASCII,而我们现代浏览器的默认字符集是ISO-8859-1。要是网页运用不同于ISO-8859-1的字符集,那就需要在标签上进行指定了。
(一)ISO字符集
ISO字符集是国际标准组织针对不同的字母表或者是语言定义的标准字符集。
世界各地使用的不同字符集:
(世界各地使用的不同字符集)
(二)Unicode标准
以上列出的字符集都是有容量限制的,并且不兼容多语言的环境,Unicode联盟就开发了Unicode标准。Unicode标准包含了世界上的所有字符、标点以及符号。不管什么平台、程序以及语言,Unicode都可以进行文本数据的处理、存储以及交换。
(三)Unicode联盟
(1)Unicode联盟开发了Unicode标准。目标是用标准的Unicode转换格式,即UTF取代现有的字符集。
(2)Unicode标准在XML、java、ECMAScript(Javascript)、LDAP、CORBA3.0、WML当中已经实现了。在大部分操作系统以及所有的现代浏览器中,Unicode也得到了支持。
(3)Unicode联盟与领导性的标准发展组织进行合作,例如:ISO、W3C以及ECMA
(4)Unicode能被不同的字符集兼容。最常用的编码方法是UTF-8以及UTF-16:
(四)UTF-8
UTF8的字符可以是1-4个字节长。UTF-8能表达Unicode标准当中的任一个字符。UTF-8向后兼容ASCII,还是网页以及电子邮件的首选编码。
(五)UTF-16
16比特的Unicode转换格式是Unicode可变字符编码,可以对全部Unicode指令表进行编码。UTF-16主要用于操作系统以及环境当中,例如:微软的Windows2000/XP/2003/Vista/CE以及Java还有.NET字节代码环境。
注意:前面的256个Unicode字符集字符对应于256个ISO-8859-1字符。全部HTML4处理器都支持UTF-8,但是,全部XHTML以及XML处理器支持UTF-8和UTF-16。
总结:以上就是关于HTML字符集的全部内容了。我们将会给大家推出更多关于html的教程。要是大家还想要了解更多更精彩的教程,那么就可以继续关注我们编程学习网教育,我们将为大家带来更多更精彩的教程以及软考等内容。