知乎上有一个提问“计算机视觉领域如何从别人的论文里获取自己的idea?” 非常有意思,这里也总结下:

Cheng Li的回答:找40篇比较新的paper,最好是开源的、你能看懂的、尽可能时髦的、大佬点赞的。然后画一个40*40的矩阵,对角线上的元素不看,还剩下1560个元素。每个元素看看A+B是不是靠谱,虽然可能99%都不靠谱。但是还是有可能筛出来15篇左右的idea,如果考虑交换性可能只有7篇也够了。或者你找40篇比较新的不是你发的oral paper,再找K篇自己的paper,也可以做这个事情,这样就不用排除对角元素了。补充:如果只是A+B需要说明为什么是non-trivial的,一般至少要改成A+B' 或者A+B+C比较容易发。

匿名用户:上面作者的答案看似调侃,但可操作程度很高,甚至很多组就在这么做。不同的是可能是从多个方向取才然后交叉,效果更佳。如果提出了新颖的、效果不错、但无法理论证明的想法(尤其我做的是无监督学习+不平衡数据+集成学习),那这种文章大概率会被毙掉。审稿人有太多方向可以攻击你,比如缺少可靠的baseline,理论不够坚实等等,即使偏应用的数据挖掘会议也不能幸免。反而是那种几个领域交叉一下,你可以说我们把A用在了C上,并借鉴了B,效果拔群。理论基础可以参考文章[1,3,4],剩下的就是加工一下motivation,跑试验证明效果好就可以了。这种套路可行吗?可行,因为我也干过。但为啥要这么做呢,主要还是因为现在投稿数量上升导致的审稿人质量方差大,这导致你必须考虑审稿人能够意识到这文章是背靠大树,踩在前人的肩膀上,靠谱。

邵浩博士:读完非常大量的论文,就会有一些对这个方向的概括性的了解,也会发现这个方向上还没有做好的问题,idea也就自然而然出来了。写论文,无非是四个层面:1)新问题,新方法;2)新问题,老方法;3)老问题,新方法;4)老问题,老方法。从四个方面都可以入手。比如说某篇论文做的是行人识别,用了算法是YOLO3,那么你是不是可以:1)做一个手上拿电脑包的行人识别,改进一下YOLO3,搞一个自己的YOLO3+的算法;2)做一个手上拿电脑包的行人识别,还是使用YOLO3,用大量的实验证明有效性;3)做一个传统的小猫识别,使用改进后的YOLO3+算法。归根结底就一点:读大量大量的论文!

总之,这些回答启发我们,一定要大量的泛读,哪怕听看看标题,看看摘要。论文重要的其实是角度,要非常快的看思路,特别感兴趣的,再去精读。

最新文章

  1. http状态代码-转载
  2. Leetcode Insert Interval
  3. 5.首次登陆与在线求助man page
  4. Python的SublimeText开发环境配置
  5. 讨厌的 StorageFolder.GetFileAsync 异常。
  6. 基于特定领域国土GIS应用框架设计及应用
  7. linker command failed with exit code 1 (use -v to see invocation),经典Xcode编译错误的出现和解决!
  8. Linux 利用hosts.deny 防止暴力破解ssh(转)
  9. ValueStack背后的OGNL表达式
  10. 最长公共子序列poj1458
  11. Velocity(1)——初步入门
  12. Android JNI 使用的数据结构JNINativeMethod详解
  13. mysql练习----Using Null
  14. 视觉显著性检测(Visual saliency detection)相关概念
  15. [py]django模板继承
  16. [AMPPZ2014]Petrol
  17. git push时报错fatal: Could not read from remote repository.
  18. phalcon: 目录分组后的acl权限控制
  19. Tarjan的强连通分量算法
  20. fixed

热门文章

  1. C# 9.0 终于来了, Top-level programs 和 Partial Methods 两大新特性探究
  2. MongoDB快速入门教程 (1)
  3. LeetCode64. 最小路径和
  4. 用户不在sudoers文件中怎么办,ziheng is not in the sudoers file解决方法
  5. Repeater 横向显示数据
  6. 如何使用JS操纵伪元素
  7. Vue-base64移动端PDF展示
  8. EM算法的收敛性
  9. day2:Number,tuple,str,list,set,dict
  10. MVC + EFCore 项目实战 - 数仓管理系统5 – 菜单配置及里程碑划分