MySQL 常见的字符集(Character Set)和排序规则(Collation)选型需结合应用场景、语言支持及性能需求,通过以上选型策略,可确保MySQL在存储、比较和排序时满足多语言支持、性能及业务逻辑需求。根据你的具体需求,你可以选择合适的排序规则。如果你不确定,可以先选择
utf8mb4_general_ci
,这是一个比较通用的选择。在选择数据库的字符集和排序规则时,需要考虑以下几个因素:
一、字符集(Character Set)选型
-
默认推荐
MySQL 8.0 默认字符集为utf8mb4
,支持多语言(包括中文、日文、韩文)及表情符号(如Emoji),是通用场景的最佳选择。旧版本utf8
仅支持部分 Unicode 字符,不推荐使用。 -
特定场景选择
- 西方语言:可选
latin1
(如英文、法文),但无法支持非拉丁字符。 - 二进制数据
- 西方语言:可选