程序中,如何采集分页文章?

现在想写个采集程序,采集分页文章,可是程序中,如何知道这篇文章最多有几页?采集中,又如何知道下一页的链接是什么(不是全部列出的)?求程序的思路... 现在想写个采集程序,采集分页文章,可是程序中,如何知道这篇文章最多有几页?采集中,又如何知道下一页的链接是什么(不是全部列出的)?求程序的思路 展开
 我来答
fkuwb
2012-01-06 · 超过49用户采纳过TA的回答
知道答主
回答量:138
采纳率:0%
帮助的人:120万
展开全部
做过这类软件的人都知道,这个其实很简单的。思路就是:先要采集到其中一个页面,然后提取包含分页部分的html代码进行分析就可以了。
追问
如果是全部列出所有的分页链接,那比较容易,如果是总有有10页,才列出5页呢?
1 2 3 4 5 下一页
这样的模式呢?
追答
容易就结了,不是还有“下一页”嘛。道理是一样的哦。
网易云信
2023-12-06 广告
很高兴能回答您的问题。以下是一段针对“一对一消息组件”的描述,字数在200字左右:该组件支持用户之间的私密交流,让沟通更加直接和高效。通过它,您可以向特定对象发送消息,并实时查看消息状态,包括对方是否已读或未读。同时,该组件还支持富文本消息... 点击进入详情页
本回答由网易云信提供
守网天外天
2012-01-05 · TA获得超过164个赞
知道小有建树答主
回答量:303
采纳率:33%
帮助的人:172万
展开全部
采集分页,难。
你需要在采集设置中设置分页的特征码,据此才能提取分页链接,且还涉及到分页的重复访问,重复采集,分页合并的顺序等等非常棘手的问题。

在熊猫采集里面,这些棘手的问题都由系统隐含解决,留给用户的只是一个“复选按钮”,用户操作起来非常简单。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式