python 如何快速提取csv中的数据矩阵?

本来用csv.reader的,读出来后是字符列表,所以得转数字,不曾想,速度实在太慢!数据规模是(42000,785),也不是特别大吧?defcsv2matrix():'... 本来用csv.reader的,读出来后是字符列表,所以得转数字,不曾想,速度实在太慢!数据规模是
(42000,785),也不是特别大吧?
def csv2matrix():
'获取csv中的数据'
l = []
reader = csv.reader(file('train.csv', 'rb'))
for line in reader:
l.append(line)
l.remove(l[0])
l = array(l)
label = l[:, 0]
data = l[:, 1:]
return nomalizing(toInt(data)), toInt(label)

def toInt(array):
array=mat(array)
m,n=shape(array)
newArray=zeros((m,n))
for i in xrange(m):
for j in xrange(n):
newArray[i,j]=int(array[i,j])
return newArray
在toInt这里运行了好久。

有什么其他方法可以加快速度吗?
展开
 我来答
黑板客
2015-07-17 · TA获得超过469个赞
知道小有建树答主
回答量:193
采纳率:100%
帮助的人:191万
展开全部

用pandas库,


import pandas as pd
data = pd.read_csv('train.csv')
train_data = data.values[0:TRAIN_NUM,1:]
train_label = data.values[0:TRAIN_NUM,0]


study.163.com/course/courseMain.htm?courseId=1000035

机器学习正好讲了这个手写识别的例子

轻松还文质彬彬的仙人掌J
2021-01-17 · 贡献了超过235个回答
知道答主
回答量:235
采纳率:0%
帮助的人:17.7万
展开全部

Python使用Tensorflow读取CSV数据训练DNN深度学习模型

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式