Lecture 1. Introduction and Basics - Carnegie Mellon - Computer Architecture 2015 - Onur Mutlu
做个实验,core0运行matlab,core1运行gcc,统计它们的运行时长
matlab的运行时长是只运行matlab时的1.07倍
gcc的运行时长是只运行gcc时的3.04倍
为什么呢?
在matlab和gcc的内存访问请求发送到 DRAM Controller 时,由于Matlab的内存访问请求具有高度 locality,因此内存控制器会优先处理Matlab的内存访问请求(性能优化)
如图是一种很经典的内存访问优化方法,使用 Row Buffer 读取 DRAM,一次读取一行。
当下一个内存访问请求到来时,如果属于同一行内存,直接从 Row buffer 拿出去
如果不是属于同一行内存,那么Row buffer 就要重新从 DRAM 读取内容
在外面,DRAM controller,或者别的什么东西,会对内存访问请求进行排序,来优化内存访问速度。
因此,可以料想,gcc的内存访问请求被DRAM controller往后排序了,因此gcc会慢得多
但这种性能优化策略也会带来问题:如下
这是内存独占。
由于STREAM程序的row buffer locality远比RANDOM程序要好,因此DRAM controller总是优先处理STREAM的内存访问请求,因此STREAM某种程度上成为了RANDOM的DDOS攻击
当然了,这种情形有一个前提:Memory Request Buffer 要足够大
======== 另一个问题:DRAM的Refresh Overhead =============
DRAM的刷新时间被设置成了64ms,但DRAM中并不是每一行Cell都无法保存超过64ms的数据。
仅仅只有一少部分Cell保存数据的时长在64-128ms
另外很少一部分Cell保存数据的时长在128-256ms
大部分Cell保存数据的时长是大于256ms的。
为了保守起见(毕竟在生产时,并非每个DRAM Cell都是一样的),我们才把Refresh gap定为 64ms
如果我们能把 memory row retention time 暴露给上层,那么是不是就可以仅对一部分memory row进行64ms 的refresh,而对其它的memory row进行间隔更长的refresh了?
这里有三个问题:
1. 这些信息暴露给谁?
2. 暴露多少信息
3. 如何确定每一行memory row的 retention time? (毫无疑问,这是最难的部分)
如图,是三星公司的一个工作。
分为三步骤:
1. 计算每一行内存的retention time(最难的部分)
2. 根据 retention time 给每一行内春的行号分配桶 (使用 Bloom Filters)
3. Memory Controller,根据不同的桶,给不同的桶的内存行用不同的刷新频率来刷新
结果:性能提升、功耗降低
似乎是一篇很棒的paper?不过我暂时不打算去读
两个很好用的建议?
============== 第三个问题:Row hammer ==============
Rowhammer对2012-2013的内存最有效,而对2014以后的内存就没什么作用了
三种可能的解决方向(so..l.解决方案并没有公布?)
最新文章
- js动态生成二维码图片
- 重温WCF之一个服务实现多个契约(二)
- OI 中的 FFT
- P168 实战练习(权限修饰符)
- Android使用Fragment程序崩溃
- C# AES加密解密算法
- SQL映射文件实现多种方式查询
- POJ1083 Moving Tables(模拟)
- Yii整合ucenter实现单点登录
- Python之 操作 MySQL 数据库
- 全方位理解Android权限之底层实现概览
- GANs用于文本生成
- sudo env
- 玩转X-CTR100 l STM32F4 l AT24C02 EEPROM存储
- restful接口设计规范总结
- Python学习-34.Python中os模块的一些方法(二)
- 在SQL2008和2012里面怎么让显示全部行和编辑 全部而不是200和1000
- idea 插件
- c语言优先级和结合性
- ubuntu 12.04网络设置