最近需要做图片中文本识别的项目,然后为了快速验证模型,所以找到了mscoco-text数据集,网站1上是这么说的:



官网是这么说的:



然而,我下下来之后:

1 - 先导入:



2 - 其中key为’imgToAnns’是图片序号对应的注释序号,却是这样的:





然后,其中具体的图片中文字并不是完全标记出来的,比如某张图片中其实一共至少4处文字,其实就标记了一处,更有甚者有的图片单词都是只标记了一半。虽然没错一共是有145862个文字例子存在:

最新文章

  1. html5 canvas常用api总结(二)--绘图API
  2. [LeetCode] Reorder List 链表重排序
  3. 基于Hadoop生态技术构建阿里搜索离线系统
  4. Asp.net Session 保存到MySql中
  5. EXT心得--并非所有的items配置对象都属于EXT的内置类
  6. 好用的ajax后台框架
  7. App开发所要注意的几个法务问题(转)
  8. 五种情况下会刷新控件状态(刷新所有子FWinControls的显示)——从DFM读取数据时、新增加子控件时、重新创建当前控件的句柄时、设置父控件时、显示状态被改变时
  9. Cloudera impala简单介绍及安装具体解释
  10. 如何阻止sql注入(pdo篇)
  11. CNCC2017中的深度学习与跨媒体智能
  12. FastDFS分布式存储实战
  13. 20175325 《JAVA程序设计》实验二《JAVA开发环境的熟悉》实验报告
  14. 13.1、多进程:进程锁Lock、信号量、事件
  15. linux每日命令(32):gzip命令
  16. SQL语句:Mac 下 处理myql 不能远程登录和本地登录问题
  17. C#窗口文件双击打开时出错
  18. mysql delimiter 存储过程
  19. 如何理解HTTP协议的“无连接,无状态”特点
  20. POJ3090

热门文章

  1. CentOS7部署Django项目
  2. python的小数据池 is和== 以及再谈编码
  3. JS中String与Array的一些常用方法
  4. 葡萄城报表V11 SP2新版本震撼发布!
  5. 没有想到speex还在持续的更新
  6. HTML中meta标签作用及属性总结
  7. maven学习笔记--window平台下的安装和一些基本的配置
  8. aop 拦截含有特定注解的类
  9. 结合 Redis 实现同步锁
  10. Oracle EBS INV 创建物料搬运单头