python sklearn对整个数据集数据标准化和先对训练级标准化再将规则用于测试集有什么区别

 我来答
腾讯电脑管家
2018-11-04 · 百度知道官方认证企业
腾讯电脑管家
腾讯电脑管家是腾讯公司推出的免费安全管理软件,能有效预防和解决计算机上常见的安全风险,并帮助用户解决各种电脑“疑难杂症”、优化系统和网络环境,是中国综合能力最强、最稳定的安全软件。
向TA提问
展开全部
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
X_num=X.shape[0]
train_index=range(X_num)
test_index=[]
test_num=int(X_num*test_size)
for i in range(test_num):
randomIndex=int(np.random.uniform(0,len(train_index)))
test_index.append(train_index[randomIndex])
del train_index[randomIndex]
#train,test的index是抽取的数据集X的序号
train=X.ix[train_index]
test=X.ix[test_index]
return train,test
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式