理解占用多少字节的关键:明确字符(CHAR)和字节(BYTE)的关系
一个汉字在不同字符编码下所占字节不同:
UTF-8:一个汉字 = 3个字节-1个字符,一个英文 = 1个字节-1个字符
GBK: 一个汉字 = 2个字节-1个字符,一个英文 = 1个字节-1个字符
Oracle
VARCHAR2(100 CHAR)表示100个字符:
- UTF8一个中文占1个字符,所以能存100个汉字
- GBK一个中文占用1个字节,所以能存100个汉字
VARCHAR2(100) 、VARCHAR2(100 BYTE)表示100个字节:
- UTF8一个中文占3个字节,所以能存33个汉字;
- GBK一个中文占用2个字节,所以能存50个汉字
// oracle查询数据库编码格式。SELECT * FROM v$nls_parameters WHERE PARAMETER='NLS_CHARACTERSET';select userenv('language') from dual;// 查看指定字符占用多少长度select lengthb('默辨xxx') from dual;
MySQL
1 及之前早期版本:
VARCHAR(100)表示100个字节。
- UTF8一个中文占3个字节,所以能存33个汉字;
- GBK一个中文占用2个字节,所以能存50个汉字
0版本:
VARCHAR(100)表示100个字符。
- UTF8一个中文占1个字符,所以能存100个汉字
- GBK一个中文占用1个字符,所以能存100个汉字
来源地址:https://blog.csdn.net/qq_44377709/article/details/126987767