怎么重定义sklearn中的方法

 我来答
芹小调安不容爽6885
2017-06-10 · TA获得超过329个赞
知道答主
回答量:346
采纳率:0%
帮助的人:103万
展开全部
首先,我觉得你可以打印出每一个步骤所需耗费的时间,看一看哪一个步骤所耗费的时间比较多,尝试着寻找优化的方法。我先说说我想到的几个点吧。

在sklearn中的一些分类方法中,其参数里用开启多进程的选项,你不妨试试看。

如果你的训练数据规模比较大,不妨试一下LSA、LDA等一些模型,先降维。这两个方法在sklearn中也是有的。

还有就是,在CountVectorizer中,mintf和maxtf参数的设置,为了避免包含过多的词。虽然这可能对速度的影响比较小,但对你的结果可能会有影响。

必须要有一个好的停用词和词典,如果你处理的是中文文本的话。

暂时就能想到这么多。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
Sievers分析仪
2025-02-09 广告
是的。传统上,对于符合要求的内毒素检测,最终用户必须从标准内毒素库存瓶中构建至少一式两份三点标准曲线;必须有重复的阴性控制;每个样品和PPC必须一式两份。有了Sievers Eclipse内毒素检测仪,这些步骤可以通过使用预嵌入的内毒素标准... 点击进入详情页
本回答由Sievers分析仪提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式