python sklearn对整个数据集数据标准化和先对训练级标准化再将规则用于测试集有什么区别

 我来答

1个回答

#热议# 上班途中天气原因受伤算工伤吗？

腾讯电脑管家
2018-11-04 · 百度知道官方认证企业

腾讯电脑管家

腾讯电脑管家是腾讯公司推出的免费安全管理软件，能有效预防和解决计算机上常见的安全风险，并帮助用户解决各种电脑“疑难杂症”、优化系统和网络环境，是中国综合能力最强、最稳定的安全软件。

关注

展开全部

#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
X_num=X.shape[0]
train_index=range(X_num)
test_index=[]
test_num=int(X_num*test_size)
for i in range(test_num):
randomIndex=int(np.random.uniform(0,len(train_index)))
test_index.append(train_index[randomIndex])
del train_index[randomIndex]
#train,test的index是抽取的数据集X的序号
train=X.ix[train_index]
test=X.ix[test_index]
return train,test

已赞过 已踩过<

评论收起

迈杰
2024-11-30 广告

RNA-seq数据分析是转录组研究的核心，包括数据预处理、序列比对、定量分析、差异表达分析、功能注释和可视化等步骤。数据预处理主要是质量控制和去除低质量序列。序列比对使用HISAT2、STAR等工具将reads比对到参考基因组。定量分析评估... 点击进入详情页

本回答由迈杰提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

pyhn，pyhn一键安装，永久使用，安装速度快

pyhn3.6.6/3.7/3.8/3.9 一键下载安装，无捆绑软件，安全无毒，适合小白，入门新手。赠送视频教程，安装，人工客服在线解决您的所有问题

soft1.dlyiykj.cn广告

阿里云_可视化数据_1元开启数据分析全新体验

阿里云，可视化数据_面向企业的专业数据可视化大屏开发工具，大模型AI助手火热公测中，让大屏开发进入AI时代。

click.aliyun.com广告

2025精选数据可视化_内容完整_免费下载

熊猫办公海量数据可视化，网站包含海量办公文档模板资源，内容丰富完整下载即用。数据可视化，专业人士起草，内容完整，正规严谨!数据可视化，任意下载，可直接套用!

www.tukuppt.com广告

为你推荐：

下载百度知道APP，抢鲜体验

使用百度知道APP，立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。

扫描二维码下载

×

个人、企业类侵权投诉
违法有害信息,请在下方选择后提交

类别

色情低俗
涉嫌违法犯罪
时政信息不实
垃圾广告
低质灌水

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交

取消

辅助

模式