本文链接:https://blog.csdn.net/williamyi96/article/details/89207640
由于最近做到了一些 3D Hand Pose Estimation 相关的内容,因而看了这篇CVPR19的 oral 论文,官方说公布源代码,但是github给的是个空repo,希望早点开源吧。

近些年来,基于 RGB图像+depth map 的 3D Hand Pose Estimation 在多个数据榜上基本饱和了,而由于本身2D single rgb image 生成 3D keypoints (21个) 的困难,目前并没有那么饱和。而最近涌现出了一批利用 depth map 来做 fine-tuning 的工作。这篇文章就是从此出发的。

总的来说,这篇论文的主要贡献在于提出了一套模型框架,不仅能够通过 RGB图像得到 Hand Pose, 同时能够从 Hand Mesh 中线性回归得到 Hand Pose。

模型总体架构
以下先从模型整体架构出发进行分析:

这篇论文模型的训练有两个阶段,第一个阶段在合成数据集上进行训练 (合成数据集由自己的手形配上COCO里面的不同背景融合得到),第二个阶段将第一阶段的模型在真实数据集上 fine-tuning, 美其名曰让模型更加鲁棒,从而能够在真实场景下表现更好。

合成数据集上的训练
合成数据集上的整体流程如上图所示:首先将 synthetic image 经过一个 two-stacked hourglass network,得到image的热力图,然后联合热力图和 hourglass network 的输出作为 resnet 的输入 feature maps (按照原文中8层的设置加上4层的pooling推测可能是浓缩 resnet18), 接着得到所谓的 latent feature 输出。然后将 latent feature 传给 graph cnn, 得到 1280 维的 3D hand mesh, 最后通过 linear regression (卷积后不接relu)得到 3D Hand Pose。

合成数据集上的损失函数由三个部分构成,分别为 heat-map loss, mesh loss 和 pose loss。

真实数据集上的训练
真实数据集上的整体流程如上图所示:模型在合成数据集上训练到满足一定要求之后,一直到graph cnn 输出,基本与上述合成数据集上一样的操作,唯一的区别是我们对 3d hand mesh 的操作不仅包括了 linear regression 得到 3d hand pose, 还包括了 mesh renderer 的操作,得到深度图 (后续将对各个步骤所使用的方法进行具体分析)。
————————————————

最新文章

  1. IOS Runtime-初识runtime(一)
  2. 转-Android仿微信气泡聊天界面设计
  3. HDU 4834 JZP Set(数论+递推)(2014年百度之星程序设计大赛 - 初赛(第二轮))
  4. Win8系统安装NET Framework 3.5的方法
  5. thymeleaf中的Literals
  6. android 26 设置项目有多个入口Activity。
  7. (转)总结PLSQL的快捷键以及使用技巧
  8. Eclipse用法和技巧十八:减少不必要的输入
  9. TDD单元测试驱动
  10. 【Yom框架】漫谈个人框架的设计之一:是IRepository还是IRepository<T>?
  11. Nginx 负载均衡 后端服务器获取前端用户真实IP
  12. 编辑器开发之 Range 范围对象的学习
  13. jquery怎么选择嵌套的第一层的li
  14. 使用.NET Core与Google Optimization Tools实现加工车间任务规划
  15. 单点登录SSO+鉴权
  16. SQL问题(面试题)
  17. java学习之maven
  18. testng入门教程12 TestNG执行多线程测试
  19. vs2008 FileUpload 上传控件 Gridview传多个值
  20. 750A New Year and Hurry

热门文章

  1. day 03 预科
  2. MySQL Replication--半同步复制(Semi-Sync Replication)
  3. Python——生成器&推导式
  4. python函数调用时参数传递方式
  5. 在Windows下/Linux下安装jdk版本
  6. 《TensorFlow2深度学习》学习笔记(二)手动搭建并测试简单神经网络(附mnist.npz下载方式)
  7. AVL树的旋转
  8. yolov1详细讲解
  9. BZOJ 4103: [Thu Summer Camp 2015]异或运算 可持久化trie
  10. learning java Charset 查看支持的字符集类型