鲲鹏处理器NUMA简介

随着现代社会信息化、智能化的飞速发展,越来越多的设备接入互联网、物联网、车联网,从而催生了庞大的计算需求。但是功耗墙问题以功耗和冷却两大限制极大的影响了单核算力的发展。为了满足智能世界快速增长的算力需求,多核架构成为最重要的演进方向。

传统的多核方案采用的是SMP(Symmetric Multi-Processing)技术,即对称多处理器结构,如图1-1所示。在对称多处理器架构下,每个处理器的地位都是平等的,对内存的使用权限也相同。任何一个程序或进程、线程都可以分配到任何一个处理器上运行,在操作系统的支持下,可以达到非常好的负载均衡,让整个系统的性能、吞吐量有较大提升。但是,由于多个核使用相同的总线访问内存,随着核数的增长,总线将成为瓶颈,制约系统的扩展性和性能。

鲲鹏处理器支持NUMA(Non-uniform memory access, 非统一内存访问)架构,能够很好的解决SMP技术对CPU核数的制约。NUMA架构将多个核结成一个节点(Node),每一个节点相当于是一个对称多处理机(SMP),一块CPU的节点之间通过On-chip Network通讯,不同的CPU之间采用Hydra Interface实现高带宽低时延的片间通讯,如图1-2所示。在NUMA架构下,整个内存空间在物理上是分布式的,所有这些内存的集合就是整个系统的全局内存。每个核访问内存的时间取决于内存相对于处理器的位置,访问本地内存(本节点内)会更快一些。Linux内核从2.5版本开始支持NUMA架构,现在的操作系统也提供了丰富的工具和接口,帮助我们完成就近访问内存的优化和配置。所以,使用鲲鹏处理器所实现的计算机系统,通过适当的性能调优,既能够达成很好的性能,又能够解决SMP架构下的总线瓶颈问题,提供更强的多核扩展能力,以及更好更灵活的计算能力。

性能调优五步法

性能优化通常可以通过如下五个步骤完成。

在性能调优经验比较少或者对系统的软硬件并不是非常了解时,可以参考使用五步法的模式逐步展开性能调优的工作。对于有丰富调优经验的工程师,或者对系统的性能瓶颈已经有深入洞察的专家,也可以采用其他方法或过程展开优化工作。

最新文章

  1. poj 1141 Brackets Sequence (区间dp)
  2. css3 实现逐帧动画
  3. 生成一行html
  4. js 数组常用方法
  5. 字符串中的一些基本操作函数(c语言)
  6. windows batch语法
  7. Fatal error: Call to a member function bind_param() on a non-object in
  8. postgresql基本操作:查看数据库、索引、表、表空间大小
  9. 大部分人努力程度之低,根本轮不到拼天赋 [转自w3cschool]
  10. 【转】读取android根目录下的文件或文件夹
  11. SGU 165.Basketball
  12. windows 驱动开发入门——驱动中的数据结构
  13. 迅为iTOP-4418开发板-Android5.1系统编译补充
  14. UpdatePanel 控件,客户端事件生命周期踩坑
  15. C语言 用π/4=1-1/3+1/5-1/7+... 求π的近似值
  16. python3网络爬虫(2.1):爬取堆糖美女
  17. 很好的git教程
  18. how do I get the difference between two R named lists?
  19. Error:No toolchains found in the NDK toolchains folder for ABI with prefix: mips64el-linux-android
  20. WebService技术,服务端发布到Tomcat(使用Servlet发布),客户端使用axis2实现(二)

热门文章

  1. NOIP模拟 21
  2. 前端与算法 leetcode 1. 两数之和
  3. P4799 [CEOI2015 Day2]世界冰球锦标赛(折半暴搜)
  4. Net Core Identity 身份验证:注册、登录和注销 (简单示例)
  5. 详细讲解 Redis 的两种安装部署方式
  6. ES6,import时如何正确使用花括号'{ }'
  7. [LC]643题 Maximum Average Subarray I(子数组最大平均数 I)
  8. Laravel上传文件(单文件,多文件)
  9. ubantu14.04安装storm伪分布式
  10. webpack优化之玩转代码分割和公共代码提取