python怎样将一个目录下的多个txt文件(每个txt文件是一对,两句话)划分为测试集和训练集

 我来答
从空去听8
2017-07-23 · TA获得超过7439个赞
知道大有可为答主
回答量:6907
采纳率:93%
帮助的人:5579万
展开全部
“按照8:2的比例对项目分出训练集和测试集”:从数据源中随机抽取80%的数据作为“训练集”,其余的是“测试集”

import random

with open("datasource.txt", 'rt') as handle:
dataset = [map(int, ln.split()) for ln in handle]

# 乱序
random.shuffle(dataset)

# [训练集, 测试集]
pos = len(dataset) *.8
parts = dataset[:pos], dataset[pos:]
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式