之前的数据集的train和test是直接按照网上下载的数据的前7000个作为训练集,后2212个作为测试集。看得出来,这个数据集是由开车录制视频转换来的图片数据,后面2000多个图片的场景和前面的场景不太一样。所以将整个数据集随机打乱,随机分配7000个训练集和2212个测试集。下面是代码:

import random
import os image_index = [] with open('/home/bnrc/all_image_index.txt','r') as f:
for line in f:
line = line[:-1]
image_index.append(line) random.shuffle(image_index)
for x in image_index:
print x # print len(image_index) for i in range(7000):
os.system('cp /home/bnrc/all_image/%s /home/bnrc/new_train/'%image_index[i])         #使用os模块,system是直接向终端输入命令。这里还有一个%s格式化输入 for j in range(7000,9212):
os.system('cp /home/bnrc/all_image/%s /home/bnrc/new_test/'%image_index[j]) # os.system('pwd')

先按照顺序把所有图片名字存一个list,然后把list打乱,再把打乱的前7000个作为训练集,后面2000多个作为测试集。

os.system:运行shell命令,注意:这里是打开一个新的shell,运行命令,当命令结束后,关闭shell

最新文章

  1. 常见input输入框 点击 发光白色外阴影 focus
  2. NIO源码阅读
  3. nginx secure_link下载防盗链
  4. vs2012中EF6的BUG
  5. indexOf()的用法
  6. 关于Switch结构利用
  7. JS(移动端)自己封装移动端一些常用方法
  8. Codeforces Round #197 (Div. 2) D. Xenia and Bit Operations
  9. 织梦dedecms单标签、双标签
  10. Jmeter Thread Group中如果存在HTTP request执行失败,就对整个Thread Group重新执行,限定最大执行次数N次
  11. LCT维护删除时间最晚生成树
  12. css3 媒体查询常用适配
  13. linux添加用户、修改密码
  14. 超级账本 --- ReadWriteSet的逻辑结构
  15. 梯度下降法实现-python[转载]
  16. HTTP简单教程
  17. 51nod 1421 最大MOD值(高妙的调和级数复杂度)
  18. MySQL 5.6 for Windows 解压缩版配置安装(转载)
  19. dedecms中的内容页中的变量
  20. 我们为什么选择JAVA

热门文章

  1. 洛谷P3312 [SDOI2014]数表(莫比乌斯反演+树状数组)
  2. 初识DetNet:确定性网络的前世今生
  3. Mysql用户root密码找回
  4. web项目数据存入mysql数据库中文乱码问题
  5. 黑马方法引用学习 Stream流 函数式接口 Lambda表达式 方法引用
  6. hibernate错误总结1
  7. django_logging
  8. scrapy框架中Spiders用法
  9. Java EE学习笔记(一)
  10. @Results( 中 params 怎么用