38 是否要使用memory引擎的表

内存表的数据组织结构

create table t1(id int primary key, c int) engine=Memory;
create table t2(id int primary key, c int) engine=innodb;
insert into t1 values(1,1),(2,2),(3,3),(4,4),(5,5),(6,6),(7,7),(8,8),(9,9),(0,0);
insert into t2 values(1,1),(2,2),(3,3),(4,4),(5,5),(6,6),(7,7),(8,8),(9,9),(0,0);

可以看到,内存表t1的返回结果里面0在最后一行,在innodb表t2的返回结果,0在第一行,二者的差别要从他们的主键索引的组织方式说起。

表t2是innodb表,是主键索引id的方式,innodb表的数据放在主键索引树上,是一个B+ tree,如下

主键索引上的值是有序存储的,在select *的时候,就会按照叶子节点上从左往右扫描,所以结果里0在第一行。

与innodb不同,memory引擎的数据和索引是分开的,

可以看到,内存表的数据部分以数组的方式单独存放,而主键id索引里,存的是每个数据的位置,主键id是hash索引,可以看到索引上的key并不是有序的。

在select * from t1内存表的时候,走全表扫描,也就是顺序扫描这个数组,因此0被最后一个读到,并放入结果集。

Innodb和memory引擎的数据组织方式不同:

--innodb表数据放在主键索引上,其他索引上保存的是主键id,-索引组织表

--而memory把数据单独存放,索引上保存数据位置的数据组织方式--堆组织表

从中可以看出,这两个引擎的一些典型不同

--1 innodb表的数据总是有序存放的,而内存表的数据就是按照写入顺序存放的

--2 当数据文件有空洞的时候,innodb表在插入新数据的时候,为了保证数据有序性,只能在固定的位置写入新值,而内存表找到空位就可以插入新值

--3 数据位置发生变化的时候,innodb表只需要修改主键索引,而内存表需要修改所有索引

--4 innodb表用主键索引查询时候需要走一次索引查找,而普通索引查询的时候,需要走两次索引查找,而内存表没有这个区别,所有所以的”地位”都是相同的。

--5 innodb支持变长数据类型,不同记录的长度可能不同,内存表不支持blob,text字段,并且即使定义了varchar(n),实际上也当中char(n),也就是固定长度字符串来存储,因此内存表的每行数据长度相同。

由于内存表的这些特性,每个数据行被删除以后,空出的这个位置都可以被接下来插入的数据复用

delete from t1 where id=5;
insert into t1 values(10,10);
select * from t1;

可以看到id=10这一行出现在id=4之后,也就是原来id=5的位置,

表t1的这个主键是哈希索引,因此如果执行范围查询

select * from t1 where id<5;

是用不上主键索引的,需要走全表扫描

Hash索引和b+tree索引

实际上,内存表也支持b+tree索引,在id列上创建b+tree

alter table t1 add index a_btree_index using btree (id);

可以看到,执行select * from t1 where id<5;,优化器选择了b+tree索引,返回结果也是0到4

其实,一般在我们的印象中,内存表的优势是速度快,其中一个原因就是memory引擎支持hash索引,当然更重要的是内存表的所有数据都在内存中,而内存中的读取速度比磁盘快。

接下来要说,在生产环境不建议使用内存表,主要原因包括

--1 锁粒度问题

--2 数据持久化问题

内存表的锁

内存表不支持行锁,只支持表锁,因此,一张表只要有更新,就会堵住其他所有的在这个表上的写操作

需要注意的是,这个表锁跟表MDL锁不同,但都是表级锁,

SESSION A

SESSION B

SESSION C

update t1 set id=sleep(50) where id=1;

select * from t1 where id=2;(堵塞50秒)

show full processlist;

跟行锁比起来,表锁对并发访问的支持不够好,所以,内存表的锁粒度问题,在处理并发事务的时候,性能也不会太好

数据持久性问题

数据放在内存中,是内存表的优势,但也是一个劣势,在数据库重启的时候,内存中的数据会被清空。

在M-S架构下,使用内存表存在的问题

--1 业务正常访问主库

--2 备库硬件升级,备库重启,内存表t1内容被清空

--3 备库重启后,客户端发送一条update语句,修改表t1的数据行,这是备库报错找不到更新的行

这样就会导致主备同步停止,当然,如果这时候发生主备切换,客户端会看到,表t1的数据丢失了

由于mysql知道重启后,内存表的数据会丢失,所以,担心主库重启之后,出现主备不一致,mysql在数据库重启之后,往binlog里面写入一行delete from t1,在备库重启的时候,备库binlog里的delete语句就会传到主库,然后把主库内存表的数据删除。

内存表并不适合生产环境作为普通表使用

所以,建议是把普通内存表都用innodb表来代替

但是有一个场景例外,就是前面说到的用户临时表,在数据量可控,不会消耗过多内存的情况下,可以考虑使用内存表。

内存临时表刚好可以无视内存表的两个不足

--1 临时表不会被其他线程看到,没有并发性的问题

--2 临时表重启后也是需要删除的,清空数据这个问题不存在

--3 备库的临时表也不会影响主库的用户线程。

前面创建临时表用于保存中间结果集

create temporary table temp_t(id int primary key, a int, b int, index(b))engine=innodb;
insert into temp_t select * from t2 where b>=1 and b<=2000;
select * from t1 join temp_t on (t1.b=temp_t.b);
--换成memory引擎
create temporary table temp_t(id int primary key, a int, b int, index (b))engine=memory;
insert into temp_t select * from t2 where b>=1 and b<=2000;
select * from t1 join temp_t on (t1.b=temp_t.b);

最新文章

  1. BZOJ4455: [Zjoi2016]小星星
  2. 修改tomcat的端口
  3. 创建 maven 本地仓库
  4. MRBS, meeting room manager system,会议预定管理系统
  5. WorldWind源码剖析系列:WorldWind如何确定与视点相关的地形数据的LOD层级与范围
  6. Dan计划:重新定义人生的10000个小时
  7. SPOJ 4053 - Card Sorting 最长不下降子序列
  8. Linux企业级项目实践之网络爬虫(26)——线程池
  9. Centos7下建立rubymine快捷方式到侧栏或桌面
  10. iOS集成友盟推送
  11. Git版本控制:Git冲突解决 相关错误总结
  12. js 对象,数组,字符串,相互转换
  13. 【原创】大叔问题定位分享(8)提交spark任务报错 Caused by: java.lang.ClassNotFoundException: org.I0Itec.zkclient.exception.ZkNoNodeException
  14. 算法(第四版)C# 习题题解——1.4
  15. 关于Java方法重载
  16. ConcurrentDictionary
  17. 四、XML语言学习(1)
  18. 爬虫基础线程进程学习-Scrapy
  19. 使用js从element的matrix推导transform的scale、rotate 和 translate参数
  20. 让Json更懂中文(JSON_UNESCAPED_UNICODE)

热门文章

  1. scala学习笔记(9)
  2. js放大镜特效
  3. element ui 选择期 传对象
  4. MySQL数据类型和约束条件
  5. 流畅的Python (Fluent Python) —— 第二部分01
  6. windows_vs编译过程
  7. ssh跳板到其他服务器
  8. Git Flow 的正确使用姿势
  9. 如何将上个SQL的结果作为参数传递给下个SQL
  10. ansible 基础操作