OpenMp作为单机多核心共享内存并行编程的开发工具,具有编码简洁等,容易上手等特点。

关于OpenMP的入门,博主饮水思源(见参考资料)有了深入浅出,循序渐进的分析。做并行开发,做性能分析是永远逃避不开的话题,性能问题的研究一切基于系统的计时。本人参考饮水思源的代码在双核与四核机器的操作过程中,发现clock()针对并行运行时间计时不准的问题,运行结果显示并行方式和串行的时间基本相近,使得并行方式在时间计数上并未有明显优势。本文就其运行时间统计做相关分析,通过改进的方式,对时间进行了判断,首先在For循环中加入打印语句判断是否多核执行;然后判断系统确实是多核执行后,在For循环中加入等待函数sleep,运行程序并人工计时,这时的时间在双核机器并行比串行要快近两倍,四核机器并行时间比串行快近四倍。所以可知clock()不适合做并行程序的计时工具,需要找到相关的替代。

    for (int i=;i<;i++)
{
std::cout<<"currend id: "<<omp_get_thread_num()<<std::endl;
sleep();
test();
}

1、For循环的串行

新建SFor.cpp文件,内容为

 #include <iostream>
#include <time.h>
#include <stdio.h>
#include <omp.h>
void test()
{
int a = ;
for (int i=;i<;i++)
a++;
}
int main()
{
struct timespec time1 = {, };
struct timespec time2 = {, };
clock_gettime(CLOCK_REALTIME, &time1);
std::cout<<"sec num: "<<time1.tv_sec<<"; nsec num: "<<time1.tv_nsec<<std::endl;
//clock_t t1 = clock();
for (int i=;i<;i++)
{
//std::cout<<"currend id: "<<omp_get_thread_num()<<std::endl;
test();
}
//clock_t t2 = clock();
//std::cout<<"time: "<<t2-t1<<std::endl;
clock_gettime(CLOCK_REALTIME, &time2);
std::cout<<"sec num: "<<time2.tv_sec<<"; nsec num: "<<time2.tv_nsec<<std::endl;
std::cout<<"time: "<<(time2.tv_sec-time1.tv_sec)*+(time2.tv_nsec-time1.tv_nsec)/1000000<<"ms"<<std::endl;
}

CentOS6.5 的GCC版本默认4.4.7,原生支持OpenMP编译

[root@localhost MPDemo]# gcc --version
gcc (GCC) 4.4.7 20120313 (Red Hat 4.4.7-4)
通过编译命令编译源文件为:

g++ -fopenmp SFor.cpp -o sfor.out

[root@localhost MPDemo]# g++ -fopenmp PFor.cpp -o pfor.out
[root@localhost MPDemo]# ./sfor.out
sec num: 1386991744; nsec num:  676508350
sec num: 1386991748; nsec num:  245595277
time: 3570ms

2、For循环的并行

新建PFor.cpp文件,内容为

 #include <iostream>
#include <time.h>
#include <stdio.h>
#include <omp.h>
void test()
{
int a = ;
for (int i=;i<;i++)
a++;
}
int main()
{
int coreNum = omp_get_num_procs();//获得处理器个数
std::cout<<"cpu numbers: "<<coreNum<<std::endl;
struct timespec time1 = {, };
struct timespec time2 = {, };
clock_gettime(CLOCK_REALTIME, &time1);
std::cout<<"sec num: "<<time1.tv_sec<<"; nsec num: "<<time1.tv_nsec<<std::endl;
//clock_t t1 = clock();
#pragma omp parallel for
for (int i=;i<;i++)
{
//std::cout<<"currend id: "<<omp_get_thread_num()<<std::endl;
test();
}
//clock_t t2 = clock();
//std::cout<<"time: "<<t2-t1<<std::endl;
clock_gettime(CLOCK_REALTIME, &time2);
std::cout<<"sec num: "<<time2.tv_sec<<"; nsec num: "<<time2.tv_nsec<<std::endl;
std::cout<<"time: "<<(time2.tv_sec-time1.tv_sec)*+(time2.tv_nsec-time1.tv_nsec)/1000000<<"ms"<<std::endl;
}

g++ -fopenmp PFor.cpp -o pfor.out

[root@localhost MPDemo]# ./pfor.out
cpu numbers: 2
sec num: 1386991842; nsec num:  452768086
sec num: 1386991844; nsec num:  527629070
time: 2074

3、分析总结

clock_gettime能获得纳秒级的精度,1秒=10^9纳秒。clock_gettime包含多种计时方式。
    a、CLOCK_REALTIME:系统实时时间,随系统实时时间改变而改变
    b、CLOCK_MONOTONIC,从系统启动这一刻起开始计时,不受系统时间被用户改变的影响
    c、CLOCK_PROCESS_CPUTIME_ID,本进程到当前代码系统CPU花费的时间
    d、CLOCK_THREAD_CPUTIME_ID,本线程到当前代码系统CPU花费的时间

本文默认采用CLOCK_REALTIME,即可实现并行程序的准确计时。示例代码如下:

     struct timespec time1 = {, };
clock_gettime(CLOCK_REALTIME, &time1);
std::cout<<"sec num: "<<time1.tv_sec<<"; nsec num: "<<time1.tv_nsec<<std::endl;

参考资料

参考比较好的入门资源:博主饮水思源的openMP的一点使用经验

最新文章

  1. 从零开始学IOS开发
  2. android开发------编写用户界面之线性布局(补充知识)
  3. 如何把TOMCAT 添加到服务中自动启动
  4. get( )与getline( )区别
  5. Redis是什么?Redis数据库全解?
  6. 压缩代码加速ecshop程序页面加载速度
  7. SAR ADC简介
  8. Java大数类介绍
  9. bzoj 1051: [HAOI2006]受欢迎的牛 tarjan缩点
  10. python Hbase Thrift pycharm 及引入包
  11. Spark操作HBase问题:java.io.IOException: Non-increasing Bloom keys
  12. nodejs 路径
  13. Java学习10——package和import
  14. 3.2、Android Studio在物理设备中运行APP
  15. vue 事件修饰符
  16. PyCharm设置Python版本
  17. buy now按钮的添加
  18. 2018.10.20 bzoj1068: [SCOI2007]压缩(区间dp)
  19. T-SQL分页查询语句
  20. 全面提升WordPress前台和后台的 打开速度的方案

热门文章

  1. Myeclipse使用过程配置汇总
  2. Qt编译目录下exe文件执行报错问题的解决办法
  3. HiveSql调优经验
  4. Pig join用法举例
  5. apache ftp server的简单入门(java应用内嵌ftp server)
  6. d3js path generator vs layouts
  7. Oracle 查询状态 自检
  8. springMVC入门-04
  9. show tables from information_schema/performance_schema/sys;
  10. mysql性能优化-慢查询分析、优化索引和配置 (慢查询日志,explain,profile)