人工智能训练云燧T10

基于邃思芯片打造的面向云端数据中心的人工智能训练加速产品,具有高性能、通用性强、生态开放等优势,可广泛应用于互联网、金融、教育、医疗、工业及政务等人工智能训练场景。

超强算力

单精度 (FP32)下算力20TFLOPS ,

半精度及混合精度 (BF16/FP16) 下算力80TFLOPS

  • 模型通用

支持CNN、RNN、LSTM、BERT等常用人工训练模型,可用于图像、
流数据、语音等训练场景 。

  • 邃思芯片基于可编程芯片的设计理念,其计算核心包含32个通用可扩展神经元处理器(SIP),每8个SIP组合成1个可扩展智能计算群(SIC)。SIC之间通过HBM实现高速互联,通过片上调度算法,数据在搬迁中完成计算,实现SIP利用率最大化。邃思支持CNN、RNN、LSTM、BERT等网络模型和丰富的数据类型(FP32/FP16/BF16/Int8/Int16/Int32等)。

GCU-CARE架构

云燧集成具有完全自主知识产权的神经元处理架构和数据处理引擎,实现片上无 Cache 设计和可重构的通用张量运算核心,支持各类数据精度的主流深度学习训练负载。

智能互联

燧原智能互联(GCU-LARE)是专为训练加速集群研发的互联技术,最大提供双向200GB/s互联带宽,支持千张云燧加速卡互联,线性加速比86%以上。

生态开放

支持主流深度学习框架,通过SDK提供深度定制。

性能表现

最新文章

  1. 「坐上时光机,查找编译压缩后的文件最初的样子」gulp-sourcemaps 使用说明
  2. codeforces716E (点分治)
  3. 安装android
  4. 最有效地优化 Microsoft SQL Server 的性能
  5. jquery and jquery validation 常见问题解决
  6. 【转】怎样将DataGridView中绑定的表的列名改成中文
  7. When Is Cheryl's Birthday
  8. 用Verilog实现IIC通讯
  9. 解读QML之三
  10. gitlab pipelines job执行时日志较大报错
  11. 新Chrome浏览器不支持html5的问题
  12. JAVA RPC (四) 之thrift序列化普通对象
  13. numpy计算结果的保存——ndarray格式数据保存
  14. POI导出Excel--合并单元格
  15. (3)The critical role librarians play in the opioid crisis
  16. C 语言结构体之点运算符( . )和箭头运算符( -> )的区别
  17. 第二章 使用接口(Using Interfaces)-书籍翻译
  18. oozie 重新提交作业
  19. 551. Student Attendance Record I
  20. swift版的StringAttribute

热门文章

  1. SpringCloud(七)Stream消息驱动
  2. 功能:Java注解的介绍和反射使用
  3. 缓冲区溢出分析第06课:W32Dasm缓冲区溢出分析
  4. hdu3987 最小割边数
  5. 基于Frida框架打造Art模式下的脱壳工具(OpenMemory)的原理分析
  6. C#-web Post/Get
  7. Learning Memory-guided Normality代码学习笔记
  8. 【maven】maven资源过滤问题<build>
  9. 11.qml-通过方法来加载组件、字符串方式加载组件
  10. 老Python带你从浅入深探究Tuple