一、库名和表结构
1 库名
强制:库的名称必须控制在32个字符以内,相关模块的表名与表名之间尽量提现join的关系,如user表和user_login表。
强制:库的名称格式:业务系统名称_子系统名,同一模块使用的表名尽量使用统一前缀。
强制:创建数据库时必须显式指定字符集,并且字符集只能是utf8或者utf8mb4,创建数据库SQL举例:create database db1 default character set utf8;。
2 表结构
强制:表和列的名称必须控制在32个字符以内,表名只能使用字母、数字和下划线,一律小写。
强制:表名要求模块名强相关,如师资系统采用”sz”作为前缀,渠道系统采用”qd”作为前缀等。
强制:创建表时必须显式指定字符集为utf8或utf8mb4。
强制:创建表时必须显式指定表存储引擎类型,如无特殊需求,一律为InnoDB,当需要使用除InnoDB/MyISAM/Memory以外的存储引擎时,必须通过DBA审核才能在生产环境中使用,因为Innodb表支持事务、行锁、宕机恢复、MVCC等关系型数据库重要特性,为业界使用最多的MySQL存储引擎,而这是其他大多数存储引擎不具备的,因此首推InnoDB。
强制:建表必须有comment。
建议:表中所有字段必须都是NOT NULL属性,业务可以根据需要定义DEFAULT值,因为使用NULL值会存在每一行都会占用额外存储空间、数据迁移容易出错、聚合函数计算结果偏差等问题。
建议:核心表(如用户表,金钱相关的表)必须有行数据的创建时间字段create_time和最后更新时间字段update_time,便于查问题。
建议:对表里的blob、text等大字段,垂直拆分到其他表里,仅在需要读这些对象的时候才去select。
建议:反范式设计:把经常需要join查询的字段,在其他表里冗余一份,如user_name属性在user_account,user_login_log等表里冗余一份,减少join查询。
强制:中间表用于保留中间结果集,名称必须以tmp_开头,备份表用于备份或抓取源表快照,名称必须以bak_开头,中间表和备份表定期清理。
强制:对于超过100W行的大表进行alter table,必须经过DBA审核,并在业务低峰期执行,因为alter table会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。
二、列数据类型优化
1 自增列
建议:表中的自增列(auto_increment属性),推荐使用bigint类型,因为无符号int存储范围为-2147483648~2147483647(大约21亿左右),溢出后会导致报错。
2 选择性少的状态字段
建议:业务中选择性很少的状态status、类型type等字段推荐使用tinytint或者smallint类型节省存储空间。
3 IP地址字段
建议:业务中IP地址字段推荐使用int类型,不推荐用char(15),因为int只占4字节,可以用如下函数相互转换,而char(15)占用至少15字节,一旦表数据行数到了1亿,那么要多用1.1G存储空间,SQL:select inet_aton(‘192.168.2.12’); select inet_ntoa(3232236044); PHP: ip2long(‘192.168.2.12’); long2ip(3530427185);
4 ENUM和SET类型
建议:不推荐使用enum,set,因为它们浪费空间,且枚举值写死了,变更不方便,推荐使用tinyint或smallint。
5 BLOB和TEXT类型
建议:不推荐使用blob,text等类型,它们都比较浪费硬盘和内存空间,在加载表数据时,会读取大字段到内存里从而浪费内存空间,影响系统性能,建议和PM、RD沟通,是否真的需要这么大字段,Innodb中当一行记录超过8098字节时,会将该记录中选取最长的一个字段将其768字节放在原始page里,该字段余下内容放在overflow-page里,不幸的是在compact行格式下,原始page和overflow-page都会加载。
6 金钱字段存储
建议:存储金钱的字段,建议用int,程序端乘以100和除以100进行存取,因为int占用4字节,而double占用8字节,空间浪费。
7 文本数据存储
建议:文本数据尽量用varchar存储,因为varchar是变长存储,比char更省空间,MySQL server层规定一行所有文本最多存65535字节,因此在utf8字符集下最多存21844个字符,超过会自动转换为mediumtext字段,而text在utf8字符集下最多存2^24-1=16777216个字符,mediumtext最多存2^24/3-1=16777216个字符,longtext最多存2^32-1=4294967295个字符,一般建议用varchar类型,字符数不要超过2700。
8 时间类型选择
建议:时间类型尽量选取timestamp,因为datetime占用8字节,timestamp仅占用4字节,但是范围为1970-01-01 00:00:01到2038-01-19-03:14:07,更为高阶的方法,选用int来存储时间,使用SQL函数unix_timestamp()和from_unixtime()来进行转换。
三、索引设计规范
1 索引数量
强制:单张表中索引数量不超过5个,限制每张表上的索引数量,建议单张表索引不超过5个索引;索引可以提高效率也可以降低效率,索引可以提高查询效率,但也会降低插入和更新的效率,尤其过多的索引会让删除变得很慢,优化器在选择如何优化查询时,会根据统一信息,对每一个可以用到的索引来进行评估,以生成出一个执行计划,所以如果发现确实索引不够用时,可以新建组合索引。
2 唯一索引命名
强制:非唯一索引必须按照“idx_<构成索引的字段名>”进行命名;在age上添加索引idx_age
强制:唯一索引必须按照“uidx_<构成索引的字段名>”进行命名;uidx_cardid
建议:组合索引建议包含所有字段名,过长的字段名可以采用缩写形式;idx_age_name
3 临时表和备份表
强制:临时表用于保留中间结果集,名称必须以tmp_开头,备份表用于备份或抓取源表快照,名称必须以bak_开头,中间表和备份表定期清理。
4 Alter Table操作
强制:对于超过100W行的大表进行alter table,必须经过DBA审核,并在业务低峰期执行,因为alter table会产生表锁,期间阻塞对于该表的所有写入,对于业务可能会产生极大影响。
四、分库分表及分区表
1 分库分表
强制:一般分库名称命名格式是库通配名_编号,编号从0开始递增,比如wenda_001;以时间进行分库的名称格式是“库通配名_时间”。
2 分区表
建议:谨慎使用MySQL分区表,业务生命周期内,评估单表数据量是否在1000万以内,超出此范围需考虑分库分表可扩展性;分区表在物理上表现为多个文件,在逻辑上表现为一个表,谨慎选择分区键,跨分区查询效率可能更低,建议采用物理分表的方式管理大数据。
3 冷热数据分离
建议:尽量做到冷热数据分离,减小表的宽度,MySQL限制每个表最多存储4096列,并且每一行数据的大小不能超过65535字节 减少磁盘IO保证热数据的内存缓存命中率(表越宽,把表装载进内存缓冲池时所占用的内存也就越大,也会消耗更多的IO)更有效的利用缓存,避免读入无用的冷数据 经常一起使用的列放到一个表中(避免更多的关联操作)。
五、DAO层设计建议
1 程序设计注意点
建议:程序设计时注意防止SQL注入,PreparedStatement是其中一种解决方案,但不建议多处硬编码SQL语句和占位符,推荐使用MyBatis或类似持久层框架管理SQL。
建议:DAL层方法返回值做拆箱处理,即:return box.getXXX();而不是 return box; 这样可以避免NPE问题。
建议:集合返回类型使用List<T>而不是Set<T>,因为框架通常无法判断两个对象的比较规则是什么,如果传入的对象不具备比较规则的话,会引起框架误判为两个不同的对象。
六、FAQs
1 什么时候使用分区表?
答:分区表适用于超大数据量的情况下,可以通过分区提高查询和管理效率,但是需要注意,分区键的选择和跨分区查询的性能问题。
6.2 为什么推荐使用InnoDB存储引擎?
答:InnoDB支持事务、行级锁、崩溃恢复和多版本并发控制(MVCC),适合高并发读写场景,是MySQL默认的存储引擎,具有更好的性能和可靠性。
以上内容就是解答有关“mysql数据库设计规范_数据库设计规范”的详细内容了,我相信这篇文章可以为您解决一些疑惑,有任何问题欢迎留言反馈,谢谢阅读。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1372352.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复