怎么重定义sklearn中的方法

 我来答

1个回答

#热议# 为什么说不要把裤子提到肚脐眼？

芹小调安不容爽6885
2017-06-10 · TA获得超过329个赞

知道答主

回答量：346

采纳率：0%

帮助的人：103万

我也去答题访问个人页

关注

展开全部

首先，我觉得你可以打印出每一个步骤所需耗费的时间，看一看哪一个步骤所耗费的时间比较多，尝试着寻找优化的方法。我先说说我想到的几个点吧。

在sklearn中的一些分类方法中，其参数里用开启多进程的选项，你不妨试试看。

如果你的训练数据规模比较大，不妨试一下LSA、LDA等一些模型，先降维。这两个方法在sklearn中也是有的。

还有就是，在CountVectorizer中，mintf和maxtf参数的设置，为了避免包含过多的词。虽然这可能对速度的影响比较小，但对你的结果可能会有影响。

必须要有一个好的停用词和词典，如果你处理的是中文文本的话。

暂时就能想到这么多。

已赞过 已踩过<

评论收起

Sievers分析仪
2025-02-09 广告

是的。传统上，对于符合要求的内毒素检测，最终用户必须从标准内毒素库存瓶中构建至少一式两份三点标准曲线；必须有重复的阴性控制；每个样品和PPC必须一式两份。有了Sievers Eclipse内毒素检测仪，这些步骤可以通过使用预嵌入的内毒素标准... 点击进入详情页

本回答由Sievers分析仪提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

怎么重定义sklearn中的方法

其他类似问题

为你推荐：