先上数据集分割代码 网上没找到合适的 自己写了一个 分割比例为0.6 :0.2 :0.2

import os
import random oriImgDir = "./change14img"
oriXmlDir = "./change14xml" #源文件夹
desTestImgDir = "./insect/images/test" #目标文件夹
desValImgDir = "./insect/images/val"
desTrainImgDir = "./insect/images/train"
desTestXmlDir = "./insect/labels/test"
desValXmlDir = "./insect/labels/val"
desTrainXmlDir = "./insect/labels/train"
# 获取目录下文件名清单
flist = os.listdir(oriImgDir)
random.shuffle(flist)
length = len(flist)
val = int(length * 0.2)
test = int(length * 0.2) count = 0 while (count < length):
# 移动测试集
while test:
item = flist[count]
fname = os.path.splitext(item)[0] # 获得不带后缀的文件名
os.rename(oriImgDir + "/" + item, desTestImgDir+"/14"+str(count)+".jpg") # 图片
os.rename(oriXmlDir + "/" + fname + ".xml", desTestXmlDir+"/14"+str(count)+".xml")
test -= 1
count += 1
# 移动验证集
while val:
item = flist[count]
fname = os.path.splitext(item)[0] # 获得不带后缀的文件名
os.rename(oriImgDir + "/" + item, desValImgDir+"/14"+str(count)+".jpg") # 图片
os.rename(oriXmlDir + "/" + fname + ".xml", desValXmlDir+"/14"+str(count)+".xml")
val -= 1
count += 1
# 剩下的移到训练集
item = flist[count]
fname = os.path.splitext(item)[0]
os.rename(oriImgDir + "/" + item, desTrainImgDir+"/14"+str(count)+".jpg") # 图片
os.rename(oriXmlDir + "/" + fname + ".xml", desTrainXmlDir+"/14"+str(count)+".xml")
count += 1

比例可以自己改,不需要验证集的话把第二个while循环去掉即可
os.rename的第二个参数是移动过去之后的文件名,可以改,如果源文件夹有很多个且有重名的情况,第二个参数就需要设计成让移过去之后新的文件名不会重复
os函数不支持跨磁盘移动文件

voc标签转txt格式代码 网上找的 源代码地址:
https://github.com/DLLXW/objectDetectionDatasets

'''
2020/6/15,标注文件转换xml转txt(vol to yolo)转完后需添加labels文件,即数字序号对应的标签名。 ''' import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join classes = ['0', '1', '2', '3', '4', '5', '6', '7', '9', '10', '12', '13', '14'] def convert(size, box):
dw = 1./(size[0])
dh = 1./(size[1])
x = (box[0] + box[1])/2.0 - 1
y = (box[2] + box[3])/2.0 - 1
w = box[1] - box[0]
h = box[3] - box[2]
x = x*dw
w = w*dw
y = y*dh
h = h*dh
if w>=1:
w=0.99
if h>=1:
h=0.99
return (x,y,w,h) def convert_annotation(rootpath,xmlname):
xmlfile = os.path.join(xmlpath,xmlname)
with open(xmlfile, "r", encoding='UTF-8') as in_file:
txtname = xmlname[:-4]+'.txt'
print(txtname)
txtpath = 'yolov5txt/train'#生成的.txt文件会被保存在这里
if not os.path.exists(txtpath):
os.makedirs(txtpath)
txtfile = os.path.join(txtpath,txtname)
with open(txtfile, "w+" ,encoding='UTF-8') as out_file:
tree=ET.parse(in_file)
root = tree.getroot()
size = root.find('size')
w = int(size.find('width').text)
h = int(size.find('height').text)
out_file.truncate()
for obj in root.iter('object'):
difficult = obj.find('difficult').text
cls = obj.find('name').text
if cls not in classes or int(difficult)==1:
continue
cls_id = classes.index(cls)
xmlbox = obj.find('bndbox')
b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
bb = convert((w,h), b)
out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n') if __name__ == "__main__":
xmlpath='insect/labels/train'
list=os.listdir(xmlpath)
for i in range(0,len(list)) :
path = os.path.join(xmlpath,list[i])
if ('.xml' in path)or('.XML' in path):
convert_annotation(xmlpath,list[i])
print('done', i)
else:
print('not xml file',i)

class列表里放的是类别,改成你自己的类别名称,类别如果没添加进去的话就会出现转化出来的txt是空的的情况

最新文章

  1. 《DSP using MATLAB》示例Example5.20
  2. .NET应用架构设计—适当使用活动记录模式代替领域模型模式
  3. Unsafe与CAS
  4. 用sql 语句给字段添加描述
  5. Flask and uWSGI - unable to load app 0 (mountpoint=&#39;&#39;) (callable not found or import error)
  6. Android内核剖析读书笔记
  7. django1.77+mod_wsgi+python2.79+apache2.24 在阿里云centos部署攻略
  8. ORACLE 计算节假日
  9. Apache 2.2 到 2.4的不同
  10. windows驱动之WDF---CharSample
  11. [Docker] 写 Dockerfile 的最佳实践理论
  12. 【转】cookie如何共享到各个浏览器
  13. Selenium+Java自动化之如何优雅绕过验证码
  14. hive 元数据库表描述
  15. CS1704问题汇总
  16. BZOJ4779: [Usaco2017 Open]Bovine Genomics
  17. 如何使用zabbix初级监控
  18. caffe---mnist数据集训练与测试
  19. tar 压缩 解压 打包命令
  20. 图片加载完毕后执行JS代码

热门文章

  1. springboot的注解声明过滤器配置错误导致拦截所有请求。
  2. Vue中使用Switch开关用来控制商品的上架与下架情况、同时根据数据库商品的状态反应到前台、前台修改商品状态保存到数据库
  3. NLP之Bi-LSTM(在长句中预测下一个单词)
  4. JS逆向实战8——某网实战(基于golang-colly)
  5. mindxdl--common--type.go
  6. KubeEdge快速上手与社区贡献实践
  7. git回滚操作系列
  8. Devexpress控件pivotGridControl显示字段面板
  9. WeetCode2滑动窗口系列
  10. -webkit-box-orient:vertical 编译报错之autoprefixer问题