本文以一个简单的程序开头——数组赋值:

int LEN = 10000;
int[][] arr = new int[LEN][LEN];

for (int i = 0; i < LEN; i++) {
for (int j = 0; j < LEN; j++) {
arr[i][j] = 1;
}
}
示例中虽然采用了Java,但是熟悉其他编程语言的同学可以自行脑补成自己熟悉的语言,如C/C++、Go、Python之类的,这里的知识点不限制在语言层级。

我们在使用这种for循环的时候,是否会习惯性地使用arr[i][j]的这种写法? 其实很多开源代码、技术书籍示例中都是如此。你是否还考虑过还有如下这种写法,即将 arr[i][j] 替换成 arr[j][i] :

int LEN = 10000;
int[][] arr = new int[LEN][LEN];

for (int i = 0; i < LEN; i++) {
for (int j = 0; j < LEN; j++) {
arr[j][i] = 1;
}
}
两段代码功能完全一样,究竟有何区别?两者性能会有数十倍或者数百倍之差。

有些同学看到这里,直接祭出IDE,运行试了一下,发现第一段代码的性能最优,所以很快地得出了a[i][j]最优的结论。不过也会有同学会运行出第二段代码性能更优的结果,即a[j][i]最优。这到底是怎么回事呢?

从语言本身看,这个问题的要点在于语言怎样实现矩阵 arr[M][N] 的存放。有两种最基本的存放方式:一种是第1下标优先存放;另一种是第2下标优先存放。也就是一般所说的行优先(Row-major)和列优先(Column-major)。

举个例子,对于下面的数组:

可以有两种存储方式:左为列优先,右为行优先。

行优先存储,顾名思义,就是一行的数据存放在一起,然后逐行存放。列优先存储,就是每一列的数据是存储在一起的,一列一列地存放在内存中。这两种存储方法,对于编写遍历二维矩阵的循环语句,还是有一定影响的。比如,如果是按行优先存储的,那么在遍历时,一行一行的读取数据,肯定比一列一列地读取整个数组,要方便许多(前者连续访问内存,有利于CPU高速缓存,后者不联系访问内存,会引起频繁更新高速缓存)。

行优先(Row-major)或者列优先(Column-major)没有好坏,但其直接涉及到对内存中数据的最佳存储访问方式。因为在内存使用上,程序访问的内存地址之间连续性越好,程序的访问效率就越高;相应地,程序访问的内存地址之间连续性越差。所以,我们应该尽量在行优先机制的编译器,比如C/C++、Objective-C(for C-style arrays)、Pascal等等上,采用行优先的数据存储方式;在列优先机制的编译器,比如Fortune、Matlab、R等等上,采用列优先的数据存储方式。但这种思想渗透到编程中之后,代码的质量就会提高一个档次。

这里没有提到市场占有率很高的Java语言,那么它们属于行优先还是列优先呢?

答案:两者都不是。

密集数组存储的一个典型替代方案是使用伊利夫向量(Iliffe vector),它通常将元素存储在连续的同一行中(如同Row-major顺序),但不存储行本身。

什么是Iliffe向量?在计算机编程中,Iliffe向量是一种用于实现多维数组的数据结构。n维数组的Iliffe向量(其中n≥2)由指向(n - 1)维数组的指针的向量(或1维数组)组成。它们通常用于避免在对数组元素执行地址计算时执行昂贵的乘法操作。它们还可用于实现交错数组,如三角形数组、三角形矩阵和其他各种不规则形状的数组。数据结构以John K. Iliffe命名。

它们的缺点包括需要多个链接指针来访问一个元素,以及需要额外的工作来确定n维数组中的下一行,以允许优化编译器预取它。在CPU明显快于主存的系统中,这两个问题都是延迟的来源。

在Java、Python(多维列表)、Ruby、Visual Basic . net、Perl、PHP、JavaScript、Objective-C(当使用NSArray时,不是一个Row-magor C-Style的数组)、Swift和Atlas Autocode等语言中的多维数组被实现为Iliffe向量。利用Iliffe向量实现OLAP产品全息的稀疏多维阵列。

回到开头,如果使用Java语言运行文中开头的2段代码,哪个更叫高效呢?请在留言区留下你的答案和思考。

最新文章

  1. RSA+DES动态加密
  2. Postman-CI集成Jenkins
  3. EF更新指定字段...
  4. Android之Inflate()方法用途
  5. Android——BitMap(位图)相关知识总结贴
  6. Lua中的捕获
  7. Because the people who are crazy enough to think they can change the world, are the ones who do.
  8. Custom.pm
  9. 安装FrameWork后重新注册IIS
  10. mongo 更新字段值,若不存在则自动创建
  11. 一个nginx服务器配置多站点
  12. VUE基于ElementUI搭建的简易单页后台
  13. openjudge noi 鸡尾酒疗法
  14. data-original
  15. javascript的执行过程, 语法错误和运行时错误?
  16. boost timer代码学习笔记
  17. Eui中eui.Image的source和texture属性赋值导致的获取高宽为0问题
  18. angular学习笔记(二十)-表单验证
  19. JAVA 线程状态转换
  20. 自定义annotation-----转载

热门文章

  1. 使用pip安装pymysql出错;Could not find a version that satisfies the requirement cryptography (from pymysql) (from versions: ) No matching distribution found for cryptography (from pymysql)
  2. proxySQL with SemiSync
  3. Graphql Tutorials(Episode 02)
  4. 2020-2021-1 20209307《Linux内核原理与分析》第一周作业
  5. vue第五单元(v-if和v-show以及v-for的灵活应用 watch以及computed的区别 (常见效果) #课程目标
  6. Eureka系列(七) 服务下线Server端具体实现
  7. Java CPU占用过高之诊断
  8. 2020软件测试工程师面试题汇总(内含答案)-看完BATJ面试官对你竖起大拇指!
  9. writeup | 你知道php的备份文件吗
  10. Python 设计模式——单例模式