科普一下GB18030:GB18030是在GB2312和GBK的基础上,完整支持所有Unicode字符的一个字符编码国家强制标准。简单来说就是UTF-GBK。它是兼容GBK的,因此现有的GBK编码文件完全不需转码便可作为GB18030文本使用。
GB18030和UTF-8相比,它的劣势有二。一是尾字节和ASCII有冲突(这是GBK带来的问题,并且已经有成熟的算法避免这个问题)。二是并不是一个国际化的方案,很多编辑器都不支持GB18030(包括记事本和notepad++,但是Visual Studio支持)。
GB18030也有优势。一是表示常用汉字的话,UTF-8需要三个字节,GB18030仅需两个字节(和GBK一样),不会明显增加网站的流量。二是GB2312和GBK可以平滑升级到GB18030而不用转码,这是最方便的。
现在全部主流浏览器都支持GB18030,因此完全没必要死抱着GBK不放了。
GB18030测试的网页源代码:
使用GB18030之前(GBK编码):
使用GB18030之后(可表示所有Unicode字符):
200字以内,仅用于支线交流,主线讨论请采用回复功能。