Mysql采坑只utf8-白红宇

Mysql采坑只utf8

阅读量：6979 次

发布时间：2019-06-27

本文共 719 字，大约阅读时间需要 2 分钟。

当然，现在建数据库时，大家一般都会使用utf8mb4，那为什么不适用utf8呢，其实是一个坑。

mysql中的utf8只支持每个字符三个字节，而真正的UTF-8是每个字符最多四字节，这可以算数Mysql的一个bug。在mysql中，真正支持UTF-8的字符集是utf8mb4，占用四个字节。

历史数据是这样的：

2003年，MySQL 从 4.1 版本开始支持 UTF-8，但是这是一个旧版的标准（RFC 2279），新版的UTF-8标准（RFC 3629）是之后才出现的。

RFC 2279最多支持每个字符 6 个字节。但是在2002年9月，MySQL源代码进行了一次调整：“UTF8 现在最多只支持 3 个字节的序列”。至于调整的原因，目前也已经无从考证了。

可以猜测一下，大概是当初的设计者想要占用更少的空间，达到更快的查询速度吧。6个字节有点多，3个字节足够了。但是这也就造成了由于存储空间不够，不能兼容RFC 3629标准。

所以utf8可以说是mysql的独创的一套字符集，并不符合字面给人的认知。人们发现了他的问题之后，期待MySQL进行修复。不过可能是因为种种原因吧，mysql并没有修复utf8的问题，而是在 2010 年重新发布了“utf8mb4”来支持真正的UTF-8。

所以呢，重要的事说三遍。

mysql中，utf8不是真正的支持UTF-8的字符集，utf8mb4才是。
mysql中，utf8不是真正的支持UTF-8的字符集，utf8mb4才是。
mysql中，utf8不是真正的支持UTF-8的字符集，utf8mb4才是。

转载于:https://blog.51cto.com/9443450/2386040

你可能感兴趣的文章