UTF-8与GB 2312编码

上一篇 / 下一篇  2012-04-20 13:10:08 / 个人分类:QT开发

 【转】

经常碰到UTF-8编码,但又说不出个所以缘来,今查了下,保存起来。

        UTF8 是(UNICODE八位交换格式)的简称,UNICODE是国际标准,也是ISO标准10646的等价标准。UNICODE编码的文件中可以同时对几乎所有地球上已知的文字字符进行书写和表示,而且已经是UNIX/LINUX世界的默认编码标准。在中国大陆简体中文版非常常用的GB2312/GB18030/GBK系列标准是我国的国家标准,但只能对中文和多数西方文字进行编码。为了网站的通用性起见,用UTF8编码是更好的选择。

        使用UTF-8编码的好处是,国外的用户如果使用Windows XP英文版,浏览UTF-8编码的任何网页,无论是中文、还是日文、韩文、阿拉伯文,都可以正常显示,UTF-8是世界通用的语言编码,UTF-8的推广要归功于Google的应用,以及Blog开发者。而如果用Windows XP英文版的IE6.0浏览gb2312语言编码的网页,则会提示是否安装语言包。因此,可能会失去很多的国外浏览者。

        GB 2312或GB 2312-80是一个简体中文字符集的中国国家标准,全称为《信息交换用汉字编码字符集•基本集》,又称为GB0,由中国国家标准总局发布,1981年5月1日实施。GB2312编码通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。


        使用gb2312编码的好处是,因为程序产生的网页文本使用ANSI编码格式,会比UTF-8文本编码节省一些体积,访问速度会稍微快一点点,大约是30:38的比例,也就是30K的ANSI编码,转为UTF-8编码是38K,当然,这个比例并不准确,是会随Unicode字符集区域的不同而变化的。


TAG: utf-8 编码 UTF-8 GB 2312

 

评分:0

我来说两句

Open Toolbar