每秒浮点运算次数[编辑]

维基百科,自由的百科全书
 
 

跳到导航跳到搜索

此条目需要补充更多来源。 (2018年2月28日)
请协助添加多方面可靠来源改善这篇条目无法查证的内容可能会因为异议提出而移除。

每秒浮点运算次数(亦称每秒峰值速度)是每秒所执行的浮点运算次数(英语:Floating-point operations per second;缩写:FLOPS)的简称,被用来估算电脑效能,尤其是在使用到大量浮点运算的科学计算领域中。因为FLOPS字尾的那个S代表,而不是复数,所以不能够省略。

浮点运算实际上包括了所有涉及浮点数的运算,在某类应用软件中常常出现,比较整数运算更用时间。现今大部分的处理器中都有浮点运算器。因此每秒浮点运算次数所量测的实际上就是浮点运算器的执行速度。而最常用来测量每秒浮点运算次数的基准程式(benchmark)之一,是Linpack

评价[编辑]

许多专家[谁?]对每秒浮点运算次数颇多微词,认为它并不是一个有意义的量度,因为FLOPS并不能反应出许多对执行效能有影响的因素。例如:I/O的效能、内存的架构、快取内存一致性(cache coherence)。这意味着电脑的实际计算容量,与FLOPS的理论峰值间会有一段不小的差距。

随着新资讯科技时代(数据挖掘、机器学习、深度学习、BIG DATA 大数据、各种人工神经网络和人工智能等)及工业革命 4.0 的发展,与 FLOPS 运算效能指标有关的计算设备以显卡 GPU 和 FPGA 为主要核心,但 FLOPS 指标却未能准确地反映出以上设备在相关领域运算的效能表现。皆因以上设备的架构是利用 CUDA、OpenCL 等编程语言来实现加速相关应用程序的运算速度(普遍达 20 倍甚至高达过千倍),而这些技术的实现依赖的更多是如 GPU 比 CPU 拥有更多倍数集成的核心,如一块 NVIDIA GeForce GTX-750Ti 处理器就拥有高达 500+ 多个 CUDA Core,其 GFLOPS 性能表现理想但 GFLOPS 并未实际对大数据运算作出很大的贡献,更多地是因为成百计以上的 CUDA 核心(每核心内置各自的 ALU 算术逻辑运算单元)能进行并行运算而产生的指数级别运算速度提升。

换算[编辑]

  • 一个MFLOPS(megaFLOPS)等于每秒一百万(106)次的浮点运算; [1]
  • 一个GFLOPS(gigaFLOPS)等于每秒十亿/十亿(109)次的浮点运算;
  • 一个TFLOPS(teraFLOPS)等于每秒一兆/一万亿(1012)次的浮点运算;
  • 一个PFLOPS(petaFLOPS)等于每秒一千兆/一千万亿(1015)次的浮点运算;
  • 一个EFLOPS(exaFLOPS)等于每秒一百京/一百亿亿(1018)次的浮点运算。

其他[编辑]

以下列出几个有代表性硬件的每秒浮点运算次数

  • 注意:本页所收集之数据于大部分情况下仅供作实际参考值,视不同设备持有者的芯片品质及运作相关(如:厂商硬件设置、主板条件、供电系统设置、运作温度会因高温而自动强制降频作保护等因素)而有所不同,大致会与参考值有 (+/-)MAX 9 % 的差异值。

浮点性能参考指标 (xFLOPS) = 总运算核心数 x 每周期运算次数 x 处理器相对运作频率 i.e.: 1,228.8 GFLOPS/1.2288 TFLOPS = 384 Core x 4 x 800 MHz(0.8 GHz)

FLOPS[编辑]

MFLOPS[编辑]

  • CRAY-1: 160 MFLOPS
  • Raspberry Pi Broadcom CM2708 ARM11 @1 GHz(OC): 316.56 MFLOPS
  • 好奇号 BAE RAD750 抗辐射处理器(基于 IBM PowerPC 750 设计)@0.1~0.2 GHz: 400 MIPS

GFLOPS[编辑]

TFLOPS[编辑]

  • Microsoft Xbox One:1.31TFLOPS
  • Microsoft Xbox One S:1.4052TFLOPS
  • NVIDIA Geforce GTX 950(GM206 GPU):1.57 TFLOPS
  • SONY PlayStation 4:1.84TFLOPS
  • AMD Radeon HD 7850(Pitcairn GPU):1.946 TFLOPS
  • NVIDIA Geforce GTX 960(GM206 GPU):2.3 TFLOPS
  • NVIDIA Geforce GTX 580(GF110-375 GPU):2.37 TFLOPS
  • NVIDIA Geforce GTX 680(GK104-400-A2 GPU):3.09 TFLOPS
  • AMD Radeon R9 380(Tonga GPU):3.48 TFLOPS
  • NVIDIA Geforce GTX 970(GM204 GPU):3.49 TFLOPS
  • NVIDIA Geforce GTX 1060(GP106 GPU):3.85 TFLOPS
  • SONY PlayStation 4 Pro:4.2TFLOPS
  • AMD Radeon HD 7970 Ghz Edition(Tahiti XT2 GPU):4.3 TFLOPS
  • NVIDIA Geforce GTX Titan(GK110 GPU):4.5 TFLOPS
  • NVIDIA Geforce GTX 980(GM204 GPU):4.61 TFLOPS
  • AMD Radeon HD 6990(R900 GPU):4.98 TFLOPS
  • NVIDIA Geforce GTX 780Ti(GK110 GPU):5.046 TFLOPS
  • AMD Radeon R9 390(Grenada GPU):5.1 TFLOPS
  • AMD Radeon RX 480(Polaris 10 GPU):5.1 TFLOPS
  • NVIDIA Geforce GTX 980 Ti(GM200 GPU):5.63 TFLOPS
  • AMD Radeon R9 290X(Hawaii XT GPU):5.632 TFLOPS
  • Microsoft Xbox One X:6 TFLOPS
  • NVIDIA Geforce GTX 1070(GP104 GPU):6 TFLOPS
  • NVIDIA Geforce GTX Titan X(GM200 GPU):7 TFLOPS
  • NVIDIA Geforce GTX Titan Z(GK110 GPU):8.122 TFLOPS
  • NVIDIA Geforce GTX 1070 ti (GP104-300) : 8.168 TFLOPS
  • AMD Radeon R9 Nano(Fiji XT GPU):8.19 TFLOPS
  • AMD Radeon HD 7990(Malta GPU):8.2 TFLOPS
  • NVIDIA Geforce GTX 1080(GP104 GPU):9 TFLOPS
  • NVIDIA Titan X(GP102 GPU):11 TFLOPS
  • NVIDIA Geforce GTX 1080 Ti(GP102 GPU):11.5 TFLOPS
  • AMD Radeon R9 295X2(Vesuvius GPU):11.46 TFLOPS
  • NVIDIA Tesla P100 (For PCIe) :18.7 TFLOPS
  • NVIDIA Tesla P100 (for NVLink): 21.2 TFLOPS
  • Earth Simulator:35.61 TFLOPS
  • NVIDIA Titan V (GV100 GPU) : 110 TFLOPS
  • NVIDIA Tesla V100 (GV100 GPU) (For PCIe) :112 TFLOPS
  • NVIDIA Tesla V100 (GV100 GPU) (for NVLink): 125 TFLOPS
  • Blue Gene/L:135.5 TFLOPS
  • 中国曙光Dawning 5000A:230 TFLOPS

PFLOPS[编辑]

EFLOPS[编辑]

参见[编辑]

注释[编辑]

  1. ^ 中文数字使用万进,一万万为一亿,一万亿为一兆,一万兆为一京;此处的兆不是SI词头mega。参见中文数字
  2. ^ IBM POWER7超高规格处理器正式发布. 2010年2月9日 [2011年12月18日]. (原始内容存档于2017年4月19日).
  3. ^ Oak Ridge Claims No. 1 Position on Latest TOP500 List with TitanTOP500. November 12, 2012 [November 15, 2012].

外部链接[编辑]

最新文章

  1. 烂泥:阿里云RDS本地恢复数据
  2. python 面向对象(进阶篇)
  3. emum类(2)
  4. csharp: WebBrowser read baidumap
  5. Python概述_软件安装_常见问题
  6. onConfigurationChanged与OnCreate,究竟谁被调用的问题
  7. JavaScript中几个可以转化为false的值
  8. GridView视图
  9. 一步一步重写 CodeIgniter 框架 (4) —— load_class 管理多个对象实例的思路
  10. 常用Linux操作命令
  11. 十五、Collections.sort(<T>, new Comparator<T>() {})针对字符串排序
  12. 2016 ACM/ICPC亚洲区青岛站现场赛(部分题解)
  13. .NET面试题系列(十三)Lucene底层原理
  14. SAP成本核算说明
  15. python调用hanlp分词包手记
  16. 【王者荣耀之IT大神版】铭文说明
  17. [Jmeter]通过批处理调用java,java从CSV动态读取登录的用户名和密码,并将其作为参数组合成字符串,写入外部.bat文件,然后通过Java执行这个外部批处理文件
  18. cout如何输出十六进制
  19. Revit二次开发示例:DeleteObject
  20. 更新yum源却忘了生成缓存 造成每次启动机器报:the package list needs to be rebuilt

热门文章

  1. [Luogu5324][BJOI2019]删数(线段树)
  2. Java 之 OutputStreamReader类
  3. mysql各版本驱动
  4. iOS退出APP
  5. 互联网项目中mysql推荐(读已提交RC)的事务隔离级别
  6. Nginx 之 Rewrite 规则
  7. java,单文件和多文件上传代码范例
  8. springcloud 之Ribbon客户端负载均衡配置使用
  9. Computer Vision_33_SIFT:Robust scale-invariant feature matching for remote sensing image registration——2009
  10. Android和kali的互操作性