由于没有使用profiler,仅仅通过简单的传输函数测试,如下测试了10000个点,1000000个点,100000000个点的速度:

均按时钟周期来计时,通过MAX调整数据

int main(){
clock_t start,finish; int *d_data,*h_data;
h_data = (int *)calloc(MAX, sizeof(int));
memset(h_data,,MAX*sizeof(int));
cudaMalloc((void **) &d_data,MAX*sizeof(int)); start = clock();
cudaMemcpy(d_data,h_data,MAX*sizeof(int),cudaMemcpyHostToDevice);
cudaMemcpy(h_data,d_data,MAX*sizeof(int),cudaMemcpyDeviceToHost);
finish = clock(); cudaFree(d_data);
free(h_data);
cout<<"time is "<<finish-start<<endl;
getchar();
return ;
}

测试结果

测试结果 10,000个节点 1,000,000个节点 100,000,000个节点
第一次测试 0 7 822
第二次测试 0 8 715
第三次测试 1 7 696

测试图表如下:

所以在小批量数组的情况下,完全可以在cpu中完成数据操作,然后device上面做简单的加和或者乘积运算。

最新文章

  1. Business Unit Lookup in Form
  2. Firemonkey 使用 TImage 显示动画图片
  3. CAD字体显示问号的解决办法
  4. Java:String和Date、Timestamp之间的转换
  5. Java Hour 55 Spring Framework 2
  6. 判断i在字符串中出现的次数(2016.1.12P141-1)
  7. mongo快速翻页方法(转载)
  8. iOS UIWebView 捕获403 、404错误
  9. java工具类--数据库操作封装类
  10. JAVA中,字符串STRING与STRINGBUILDER的效率差异
  11. Struts2学习笔记①
  12. 使用 Proxy + Promise 实现 依赖收集
  13. UOJ#370. 【UR #17】滑稽树上滑稽果 动态规划
  14. ambiguous
  15. [转]Laravel 数据库实例教程 —— 使用查询构建器实现对数据库的高级查询
  16. [转帖]UEFI和BIOS
  17. mysql 时间类型精确到毫秒、微秒及其处理
  18. tensorflow 的tf.split函数的用法
  19. 运行vue项目--安装vue脚手架vue cli
  20. E3-1260L (8M Cache, 2.40 GHz) E3-1265L v2 (8M Cache, 2.50 GHz)

热门文章

  1. JDK 8 - java.util.HashMap 实现机制分析
  2. Oracle 数据库表(常见的表)
  3. SUSE 安装mysql
  4. scrapy-redis源码抛析
  5. 虚拟化系列-VMware vSphere 5.1 简介与安装
  6. javascript——屏蔽右键快捷菜单
  7. 10-13C#语句(1)
  8. DAY16-Django之MTV
  9. 安卓读取SD卡的容量
  10. @SuppressWarnings(&quot;unused&quot;)注解的作用