大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家介绍的是i.MXRT定时器PIT的多通道链接模式及其在coremark测试里的应用

  早在 2018 年 i.MXRT 系列跨界处理器刚推出的时候,痞子衡就写了一篇 《i.MXRT1052性能实测(CoreMark)》,文章详细介绍了在 i.MXRT 上如何一步一步地移植标准 coremark 程序,这篇文章阅读量还不错,据说很多人移植 coremark 都是看得这篇文章。

  当时痞子衡把移植好的 coremark 工程也一起开源了出来,并且这个仓库痞子衡也是在不断维护的(增加新 MCU 型号支持,以及除了 coremark 之外的一些其他经典程序)。最近有同事向痞子衡反映,这个 coremark 测试工程里关于计时部分有一些可以改进的地方,痞子衡看了一下,确实可以改进,这便是今天本文要聊的主题:

一、i.MXRT上的定时器简介

  工欲善其事,必先利其器。在改进 coremark 测试工程里计时功能之前,我们先来了解一下 i.MXRT 上都有哪些跟计时/计数相关的模块,分别是什么特点,下面是详细列表。单从计时功能角度考虑,SysTick、GPT、PIT、TMR 都是不错的选择。

定时器 基本特性 应用特色
SysTick 24bit 计数器 系统(内核)时钟节拍
GPT 32bit 计数器 计时,外部信号捕获,比较
PIT 32bit 计数器 x 4 ch(可级联) 系统生命周期计时,触发DMA
TMR 16bit 计数器 x 4 ch(可级联) 混合功能:计时,信号捕获,正交解码
eFlexPWM 16bit 计数器 x 6 ch PWM信号生成
QDC 16bit,32bit - 5 ch 连接位置/速度传感器,正交解码
WDOG 给定时间选项/16bit 系统复位

二、计时设计对coremark测试程序影响

  我们知道 coremark 标准的测试逻辑是在某配置参数组合下单位时间内跑了多少次 coremark 程序,一般情况下要求至少跑 10s 以上,因此计时部分的设计是很重要的。

  在早期 i.MXRT1050 coremark 工程里,痞子衡选用了 PIT(channel 0 - 32bit)负责计时,为 PIT 配置的时钟源是 24MHz 外部 OSC,定时器一次超时耗时约 178s,这种情况下,痞子衡也没有使能 PIT 中断,假定了一次 coremark 程序跑完不会碰到超时的情况,但显然这种设计是不完善的。

  此外我们知道定时器时钟源频率越高,计时粒度越细,计时时间也就越精确。大部分定时器时钟源都可以配到系统 IPG bus 总线频率(在 i.MXRT10xx 上可到 125MHz/150MHz,在 i.MXRT1170 上可到 240MHz),我们可以尝试将定时器设到最高频率的时钟源,这时候就不得不考虑定时器超时中断处理问题了。

  使能定时器超时中断,可以保证计时的严谨性,解决了 coremark 程序运行时间和次数的限制。但是频繁的定时器中断响应也会不断打断 coremark 程序的执行,对最终跑分结果产生不利影响,这个问题同样需要解决。

三、PIT定时器多通道链接模式

  前面说了 SysTick、GPT、PIT、TMR 都可以用作 coremark 测试工程定时器,但最终痞子衡还是选定了 PIT,因为 PIT 是最适合作为系统运行生命周期总计时器的,这主要得益于 PIT 内部有 4 个 32bit 计时器,并且可以链接使用(串连)。

  要是将 4 个 32bit 计数器串成一个 128bit 超强计数器(channel 0 计数溢出,channel 1 计数加 1...),即使系统运行到地老天荒都不会出现一次超时(这里指最后一链 channel 3 中断触发),所以也就根本不用管定时器中断处理的事。

  PIT 通道链接模式使能也很简单,主要在 PIT->CHANNEL[x].TCTRL[CHN] 位上,这个位开启后,channel x 就和 channel x-1 连了起来。下面是 channel 0 和 channel 1 串连组成 64bit 计数器的初始化代码:

void timer_pit_init(void)
{
// Turn on PIT: MDIS = 0, FRZ = 0
PIT->MCR = 0x00; // Set up timer 1 to max value
PIT->CHANNEL[1].LDVAL = 0xFFFFFFFF; // setup timer 1 for maximum counting period
PIT->CHANNEL[1].TCTRL = 0; // Disable timer 1 interrupts
PIT->CHANNEL[1].TFLG = 1; // clear the timer 1 flag
PIT->CHANNEL[1].TCTRL |= PIT_TCTRL_CHN_MASK; // chain timer 1 to timer 0
PIT->CHANNEL[1].TCTRL |= PIT_TCTRL_TEN_MASK; // start timer 1 // Set up timer 0 to max value
PIT->CHANNEL[0].LDVAL = 0xFFFFFFFF; // setup timer 0 for maximum counting period
PIT->CHANNEL[0].TFLG = 1; // clear the timer 0 flag
PIT->CHANNEL[0].TCTRL = PIT_TCTRL_TEN_MASK; // start timer 0
}

  实际上我们也根本不需要 128bit 计数器,64bit 计数器就完全够用了,就以 150MHz 时钟源来说,超时一次需要约 3899 年,谁需要操心 3899 年后的事情呢?此外,在 channel 0 和 channel 1 串联的情况下,PIT 还提供了一个 64bit lifetime 计数器,直接读这个计数器就能获取当前 channel 0,1 串连的计数值,不用考虑手动读 channel 0,1 计数值可能会发生的潜在翻转问题(rollover)。

  你看,使能了 PIT 通道链接用法后就完美地解决了 coremark 测试程序计时设计问题。

uint64_t timer_pit_get_ticks() {
uint64_t valueH;
volatile uint32_t valueL; #if defined(FSL_FEATURE_PIT_HAS_LIFETIME_TIMER) && (FSL_FEATURE_PIT_HAS_LIFETIME_TIMER == 1)
valueH = PIT->LTMR64H;
valueL = PIT->LTMR64L;
#else
do
{
valueL = PIT->CHANNEL[0].CVAL;
valueH = PIT->CHANNEL[1].CVAL;
} while (valueL < PIT->CHANNEL[0].CVAL);
#endif // FSL_FEATURE_PIT_HAS_LIFETIME_TIMER return ~((valueH << 32) | valueL);
}

四、关于coremark上计时的其他改进点

  最后再提两个 coremark 测试程序设计小改进点,一是在一些双核型号上(比如 i.MXRT1170, CM7 和 CM4),如果两个核同时跑 coremark 程序要用到不同 PIT 的话,需要检查它们是不是共用一个时钟开关,防止出现 CM7 上跑完了 coremark 之后关掉 PIT,影响 CM4 那边 coremark 程序对 PIT 寄存器的访问。

  第二个改进点是 core_main.c 里的 main() 函数在打印 Total ticks 时会将 u64 型的 total_time 变量强制转为 u32 型,以便于 %lu 格式化输出(32位无符号整数),这里最好还是保留原来 u64 精度,痞子衡尝试了 %llu 格式化输出(64位无符号整数),结果在 ee_printf() 下不生效,所以做了个如下手动转换版:

MAIN_RETURN_TYPE main(void) {
// 代码省略...
uint64_t total_time; total_time=get_time(); //ee_printf("Total ticks : %lu\n",(ee_u32)total_time);
if (total_time & (~(uint64_t)0xFFFFFFFF))
{
ee_printf("Total ticks : ");
ee_printf("%lu", (ee_u32)(total_time / 1000000000));
ee_printf("%lu\n",(ee_u32)(total_time % 1000000000));
}
else
{
ee_printf("Total ticks : %lu\n",(ee_u32)total_time);
} // 代码省略...
}

  至此,i.MXRT定时器PIT的多通道链接模式及其在coremark测试里的应用痞子衡便介绍完毕了,掌声在哪里~~~

欢迎订阅

文章会同时发布到我的 博客园主页CSDN主页知乎主页微信公众号 平台上。

微信搜索"痞子衡嵌入式"或者扫描下面二维码,就可以在手机上第一时间看了哦。

最新文章

  1. 可视化(番外篇)——在Eclipse RCP中玩转OpenGL
  2. 对URL编码
  3. Speed-BI数据分析案例:2016年7月汽车销量排行榜
  4. 怎么限制Google自动调整字体大小
  5. [GDI+] C# ImageClass帮助类教程与源码下载 (转载)
  6. js 数字
  7. SoC嵌入式软件架构设计II:没有MMU的CPU虚拟内存管理的设计和实现方法
  8. Web前端开发的一点记录
  9. SASS使用CSS3动画并使动画暂停和停止在最后一帧的简单例子
  10. redis多端口,多实例。
  11. IIS 配置 FTP 网站
  12. EBS DBA指南笔记(三)
  13. 在Mac OS X中配置Apache + PHP + MySQL 很详细
  14. nsx-edge虚拟机抓包实践
  15. RAMDISK 内存盘工具推荐
  16. H5滑条(input type=range)
  17. saltstack系列~第三篇
  18. grep与孪生兄弟egrep差异
  19. (译文)The Linux Programming Interface:第1章(历史和标准)
  20. Delphi 的内存操作函数(5): 复制内存

热门文章

  1. SQL高级优化(四)之SQL优化
  2. SQL高级优化(一)之MySQL优化
  3. vue3.0+vite项目搭建
  4. Sentry 企业级数据安全解决方案 - Relay PII 和数据清理
  5. Linux环境下的Docker的安装和部署、学习二
  6. Windows蓝牙失效超全攻略
  7. Cesium入门9 - Loading and Styling Entities - 加载和样式化实体
  8. 推荐召回--基于用户的协同过滤UserCF
  9. Servlet Session的使用
  10. Linux创建运行C/C++代码