设置数据存储编码格式
1)utf8
2)utf8mb4 (支持Emoji 表情(Emoji 是一种特殊的 Unicode 编码,常见于 ios 和 android 手机上))
校对集 collate
每种字符集都对应一些校对集,校对集会影响到排序规则、where查询、group by having结果、影响创建索引、影响连接查询索引、distinct等查询
1)utf8mb4_general_ci ( 大小写无关 Case Insensitive 、没有实现Unicode排序规则 )
2)utf8mb4_unicode_ci ( 基于标准的Unicode来排序和比较,能够在各种语言之间精确排序 )
3)utf8mb4_general_cs ( 区分大小写 Case Sensitive )
4)utf8mb4_bin ( 直接将所有字符看作二进制串,然后从最高位往最低位比对。所以很显然它是区分大小写的 )
校对集优先级(字符集优先级同样的顺序)
查询语句(sql)> 列(colmun) > 表(table) > 数据库(database) > mysql实例 (mysql server)
如果全都显示设置了,那么优先级顺序是 SQL语句 > 列级别设置 > 表级别设置 > 库级别设置 > 实例级别设置。
也就是说列上所指定的COLLATE可以覆盖表上指定的COLLATE,表上指定的COLLATE可以覆盖库级别的COLLATE。
如果没有指定,则继承下一级的设置。即列上面没有指定COLLATE,则该列的COLLATE和表上设置的一样
设置字符集、校对级的语句
1)mysql实例在字符集、校对级在my.cnf配置文件设置
2)数据库的字符集、校对级在创建语句指定
CREATE DATABASE DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
3)表的字符集、校对级在创建语句指定
CREATE TABLE (
……
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
4)列的字符集、校对级在创建语句指定
CREATE TABLE (
"column1" VARCHAR(64) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL DEFAULT "",
……
) ……
5)查询语句的校对级在查询语句指定
SELECT DISTINCT column1 COLLATE utf8mb4_general_ci FROM table1;
SELECT column1, column2 FROM table1 ORDER BY column1 COLLATE utf8mb4_unicode_ci;