CeiT:Incorporating Convolution Designs into Visual Transformers

将CNN提取low-level特征,强化局部特征提取的能力,与Transformer获取long-range信息的能力相结合提高模型性能。

Step1 : image-->tokens 利用卷积提取浅层特征信息

Vit将输入图像直接split成patch; CeiT利用conv+BN+Max-pooling提取浅层特征

Step 2 : 在空间维度上促进相邻token的相关性

Step3: 综合不同层的信息,提出Layer-wise Class token Attention模块计算每层的class token的相互关系

LCA模块的输入是不同层的class token

最新文章

  1. f2fs解析(六)
  2. Yii源码阅读笔记(十八)
  3. Linux 通过 load average 判断服务器负载情况
  4. 访谈将源代码的函数 strcpy/memcpy/atoi/kmp/quicksort
  5. 关于.ToList(): LINQ to Entities does not recognize the method ‘xxx’ method, and this method cannot be translated into a store expression.
  6. 如何在Byte[]和String之间进行转换
  7. 移动端touch点穿(穿透)解决办法
  8. Logistic Regression理论总结
  9. JPA:identifier of an instance of was altered from
  10. [Redux] redux之combineReducers
  11. Android艺术——深看Activity的生命周期
  12. python 中range函数的用法
  13. jquery <img> 图片懒加载 和 标签如果没有加载出图片或没有图片,就显示默认的图片
  14. SQL语句执行性能
  15. k近邻算法(KNN)
  16. DELPHI新的变量的声明方法
  17. windows下 两个版本的JDK环境变量进行切换 MARK
  18. clang命令理解程序
  19. ubuntu桌面安装常用软件&及常见问题
  20. BFC(块级格式化上下文)

热门文章

  1. 关于filter_input函数
  2. OSPF配置常用命令知识总结
  3. 滚动 Scroller OverScroller
  4. 《Vue.js 3.x高效前端开发(视频教学版)》简介
  5. 使用laydate时间输入控件
  6. 域名证书https配置问题
  7. TCP 协议之三次握手(一)
  8. new关键字解析
  9. Flink akka AskTimeoutException问题排查
  10. python菜鸟学习: 1.用户登录输入输出