一.在列表中筛选数据 在列表中筛选出大于等于零的数据,一般通用的用法代码如下: data = [3, -9, 0, 1, -6, 3, -2, 8, -6] #要筛选的原始数据列表 result = [] #存放筛选结果的列表 for x in data: #依次迭代循环每个元素 if x >= 0: #判断是否符合筛选条件 result.append(x) #大于等于零就将该元素加入结果列表中 print(result) #打印输出 在python 中还有更加简洁高效的方法: 1.filter
根据Survey of Data-Selection Methods in Statistical Machine Translation的总结,MT中的数据选择分类图如下: 使用场景 数据使用的场景决定了选择什么样的数据,及该方法要解决什么问题. Improve Quality:Domain Improvement.Unhelpful Data Reduction.Noise Reduction Limited Resources:Training Resources.Deployment R