制作新的train,test数据集
2024-09-02 09:28:31
之前的数据集的train和test是直接按照网上下载的数据的前7000个作为训练集,后2212个作为测试集。看得出来,这个数据集是由开车录制视频转换来的图片数据,后面2000多个图片的场景和前面的场景不太一样。所以将整个数据集随机打乱,随机分配7000个训练集和2212个测试集。下面是代码:
import random
import os image_index = [] with open('/home/bnrc/all_image_index.txt','r') as f:
for line in f:
line = line[:-1]
image_index.append(line) random.shuffle(image_index)
for x in image_index:
print x # print len(image_index) for i in range(7000):
os.system('cp /home/bnrc/all_image/%s /home/bnrc/new_train/'%image_index[i]) #使用os模块,system是直接向终端输入命令。这里还有一个%s格式化输入 for j in range(7000,9212):
os.system('cp /home/bnrc/all_image/%s /home/bnrc/new_test/'%image_index[j]) # os.system('pwd')
先按照顺序把所有图片名字存一个list,然后把list打乱,再把打乱的前7000个作为训练集,后面2000多个作为测试集。
os.system:运行shell命令,注意:这里是打开一个新的shell,运行命令,当命令结束后,关闭shell
最新文章
- 常见input输入框 点击 发光白色外阴影 focus
- NIO源码阅读
- nginx secure_link下载防盗链
- vs2012中EF6的BUG
- indexOf()的用法
- 关于Switch结构利用
- JS(移动端)自己封装移动端一些常用方法
- Codeforces Round #197 (Div. 2) D. Xenia and Bit Operations
- 织梦dedecms单标签、双标签
- Jmeter Thread Group中如果存在HTTP request执行失败,就对整个Thread Group重新执行,限定最大执行次数N次
- LCT维护删除时间最晚生成树
- css3 媒体查询常用适配
- linux添加用户、修改密码
- 超级账本 --- ReadWriteSet的逻辑结构
- 梯度下降法实现-python[转载]
- HTTP简单教程
- 51nod 1421 最大MOD值(高妙的调和级数复杂度)
- MySQL 5.6 for Windows 解压缩版配置安装(转载)
- dedecms中的内容页中的变量
- 我们为什么选择JAVA