字节 字符 字符集 UTF8 ZHS16GBK

上一篇 / 下一篇  2010-03-23 16:44:30 / 个人分类:02 测试随笔

字符是参数或变量的一种类型
字节是参数或变量的存储类型或存储大小的单位.
字符占一个字节,但只占一个字节的不一定是字符

一个汉字=2个字节是通常的情况,在UTF8下的话,就是一个汉字=3个字节

bit、byte、位、字节、汉字的关系


        1 bit     = 1  二进制数据
        1 byte  = 8  bit
        1 字母 = 1  byte = 8 bit
        1 汉字 = 2  byte = 16 bit


1. bit:位
    一个二进制数据0或1,是1bit;

2. byte:字节
    存储空间的基本计量单位,如:MySQL中定义VARCHAR(45)  即是指 45个字节;
    1 byte = 8 bit

3. 一个英文字符占一个字节;
    1 字母 = 1 byte = 8 bit

4. 一个汉字占2个字节;
    1 汉字 = 2 byte = 16 bit

5. 标点符号
    A>.  汉字输入状态下,默认为全角输入方式;
    B>.  英文输入状态下,默认为半角输入方式;

    C>.  全角输入方式下,标点符号占2字节;
    D>.  半角输入方式下,标点符号占1字节;

    故:汉字输入状态下的字符,占2个字节 (但不排除,自己更改了默认设置);
            英文输入状态下的字符,占1个字节 (但不排除,自己更改了默认设置);



        老美在发明电脑时,肯定以自己的英文字母--即他们自认为的字符为最小的存储计量单位,于是也就有了不规范的1字符=1byte, 岂不知还有我们伟大的汉字计量单位,NND,一个汉字也是一个字符,我们的1汉字字符就等于2byte,后来,他们可能意识到这个尴尬的问题,于是又标榜为:一个字母为一个标准字符,去球吧,谁整天没事说个字符还“标准字符”,所以啊,个人认为:字符,不能用于标准的计量单位。


TAG:

 

评分:0

我来说两句

Open Toolbar