下载imagenet2012数据集,以及label说明
updated@2018-12-07 15:22:08
官方下载地址:http://www.image-net.org/challenges/LSVRC/2012/nonpub-downloads ,需要“非.com结尾的邮箱注册的账号”
也可以从网盘下载,链接:https://pan.baidu.com/s/17gQSrqD2j921HEMYVGVZ7Q 密码:28fj
(注:此网盘分享目录中没有test和train的image,因为都比较大,没有传)
下面听我啰嗦一下:
分类和定位任务(task1&&task2, 即classification && localization)
图片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_val.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar(三个任务的test图片都在一个压缩包里)
开发包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar (含val标签)
标签
synset.txt下载地址:
分类任务(classification)的val的标签在开发包里:D:\data\imagenet\ILSVRC2012_devkit_t12\data\ILSVRC2012_validation_ground_truth.txt
,开头几行:
490 #表示第1张val的图片,label为490
361
171
822
这个label有个小问题:和一些开源的caffemodel的输出对不上,比如MobileNet,对于ILSVRC2012_val_00000001.JPEG的top1预测结果是:
confidence: 0.75
category index: 65
label: 'n01751748 sea snake'
但是从ILSVRC2012_validation_ground_truth.txt看到的label是490。两种解决思路:
1)使用caffe版本的imagenet2012分类任务label,而不是devkit中的。
基于caffe训练的,使用了get_ilsvrc_aux.sh文件下载的imagenet的label。这些label和imagnet官方的不一样。
其实就是从http://dl.caffe.berkeleyvision.org/caffe_ilsvrc12.tar.gz下载的caffe版本imagenet标签。
2)使用映射表,把基于caffe版本的imagenet分类label,映射为imagenet原版lable,或把imagenet原版label映射为caffe版本。
映射表下载地址:https://github.com/fh295/semanticCNN/blob/master/imagenet_labels/ILSVRC2012_mapping.txt 。至于这个映射表怎么来的,迷一样。
BBox
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar.gz (我只做分类任务,这些框没有用过)
检测任务(task3, object detection)
图片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train_t3.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar (前面列出过了,三个任务的test图片都在一个压缩包里)
开发包
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t3.tar.gz
标签
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_bbox_train_v2.tar
评论区有人提到没有给annotation的下载地址。原版地址忘记了,不过可以从百度网盘下载:
关于label的说明(仅验证过validation的label,train理论上也是这样):
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_devkit_t12.tar.gz
吐槽
caffe标签到原版标签的映射:
caffemodel预测出top1的index是idx(比如65),加上1就是66,对应到synsets.txt第66行,也就是n01751748;从ILSVRC2012_mapping.txt找到n01751748,对应的映射id为490,表示原版imagenet label是490(1开始标记)或489(0开始标记)
整这么麻烦,其实直接用caffe版本的标签好了。。
最新文章
- CentOS7下mysql5.6修改默认编码
- 友盟消息推送UPush
- EasyUI ComboGrid 分页
- c++ web服务器
- Java基础之序列化对象——将对象写入到文件中(SerializeObjects)
- springmvc处理ajax请求
- js ajax乱码查看\u8fdb\u53e3
- CodeForces 732B Cormen — The Best Friend Of a Man (贪心)
- Zlib压缩算法在Java与Delphi间交互实现(压缩XML交互)
- ruby抓取web页面
- MySQL 创建、删除、显示数据库、数据表
- about this blog
- python—DAY1
- [转]vux使用教程
- python之计算机硬件基本认知_数据单位_进制间转换_数的原码反码补码
- 【Teradata】grouping和rollup窗口函数
- Docker安装准备
- Visual Studio 2012 智能提示功能消失解决办法
- canvas实现验证码
- ML平台_饿了么实践