python怎样将一个目录下的多个txt文件(每个txt文件是一对,两句话)划分为测试集和训练集
展开全部
“按照8:2的比例对项目分出训练集和测试集”:从数据源中随机抽取80%的数据作为“训练集”,其余的是“测试集”
import random
with open("datasource.txt", 'rt') as handle:
dataset = [map(int, ln.split()) for ln in handle]
# 乱序
random.shuffle(dataset)
# [训练集, 测试集]
pos = len(dataset) *.8
parts = dataset[:pos], dataset[pos:]
import random
with open("datasource.txt", 'rt') as handle:
dataset = [map(int, ln.split()) for ln in handle]
# 乱序
random.shuffle(dataset)
# [训练集, 测试集]
pos = len(dataset) *.8
parts = dataset[:pos], dataset[pos:]
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询