关于八爪鱼采集器采集分页的问题
展开全部
根据你的描述来看,这个是个非常特殊的下一页按钮,绝大多数的网页上的下一页链接或者按钮,八爪鱼采集器都能自动识别并自动添加下一页循环,但是也有非常少的特殊情况,你这种就是,这种情况下其实处理起来也不难,只是不能全自动生成采集流程,要稍微半自动手动拖一下流程:具体的操作方式我查阅了八爪鱼论坛,以下是摘录的八爪鱼论坛回帖中的解决方案:
“建议你把你的页面地址发出来,看看你的下一页是不是比较特殊,如果是你这个下一页的标签比较特殊,可以通过以下方式来手动建立下一页循环:
1. 获取下一页的XPath,有好几种方式:
使用firepath。
在群里找客服帮你。
建立一个测试任务,打开包含下一页的页面,直接点击提取下一页的文字,选中提取的字段,点自定义按钮,选第二项,里面有一个“//”开头的一串字符,就是XPath。
2. 回到你的任务,当你导航至列表页需要创建翻页循环的时候,不用惦记下一页,直接拖一个循环动作到流程中,打开高级选项,选中循环固定元素,并在右边输入获取的XPath,点保存。
3. 拖动一个点击动作到循环内部,打开高级选项,选中“使用当前循环项”,点保存。
通过以上步骤即可实现手动创建翻页循环。”
“建议你把你的页面地址发出来,看看你的下一页是不是比较特殊,如果是你这个下一页的标签比较特殊,可以通过以下方式来手动建立下一页循环:
1. 获取下一页的XPath,有好几种方式:
使用firepath。
在群里找客服帮你。
建立一个测试任务,打开包含下一页的页面,直接点击提取下一页的文字,选中提取的字段,点自定义按钮,选第二项,里面有一个“//”开头的一串字符,就是XPath。
2. 回到你的任务,当你导航至列表页需要创建翻页循环的时候,不用惦记下一页,直接拖一个循环动作到流程中,打开高级选项,选中循环固定元素,并在右边输入获取的XPath,点保存。
3. 拖动一个点击动作到循环内部,打开高级选项,选中“使用当前循环项”,点保存。
通过以上步骤即可实现手动创建翻页循环。”
展开全部
八爪鱼采集器提供了循环翻页功能,可以帮助用户采集多页数据。在八爪鱼中,用户可以选择循环列表框,然后回到列表页面,选择页面中的下一页按钮,并点击循环点击下一页,创建循环翻页。创建循环翻页后,八爪鱼会自动点击下一页按钮进行翻页,从第1页,第2页......直到最后1页。如果只需采集特定页的数据,可在八爪鱼中设置循环翻页的次数。八爪鱼为用户准备了一系列简洁易懂的教程,帮助大家快速掌握采集技巧,轻松应对各类网站数据采集,请前往官网教程与帮助了解更多详情。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询