如何写火车头采集器的采集规则,采集页面上图片内的文字?

有木有人会啊?苍天。... 有木有人会啊?苍天。 展开
 我来答
右手规则
2012-03-07 · TA获得超过373个赞
知道答主
回答量:154
采纳率:0%
帮助的人:114万
展开全部
不得不说火车头是有一定用处,但是个人觉得不怎么好用,光是写那些采集规则,设定什么的就一大堆不明不白的东西。拿钱购买嘛,一开始那客服还很热情的为你解答,一交完钱买下来了,写规则,好了,有问题要找客服解决,结果一拖再拖,弄了一个多月还没弄好,整个网站的工作进程全拖慢了,还不如自己辛苦点自己手动写文章,还采集啥啊~
言归正传,火车头使用:新建站点—>新建任务—>填写你要采集的网站文哗液春章列表—>点下面的开始测试网址—>如果有采集到很多文章,看各个地址相同部分(如system/2012/03/07),点返回修改,把system/2012/03/07这部分加到“文章内容必须包含”那里,再测试一下,就可以采集到3月7日的文章地址了—>前面准备好网址后接下来就是第二步的采集内容规则了,点第二步,设定标签,一般采集包括标题<title></title>、关键字<meta name=keyword...>、内容<div>...</div>,这些设置从你要采集的网站代码上可以找到相应的——>采集页面上的图片,在第四步,“文件保存及高级设置”,选择所有文件本地保存文件夹(这里是从页面下载图片存放的位置),然后下面有个FTP同步文件上传的,填好服务器、用户名、密码什么的,文件上传根目录就是乱耐你网站服务器放置图片的文件夹位置,你可以在服务器新建一个文件夹试试看,OK!到此为止,不过有一些网站写了反采集代码,有可能会被封IP,整体来说,个人不提倡使用火车头采集器,还不如个人手动来得实在,就算一天少发点也行,只要保证每天更新量、伪埋仿原创和原创,一样有很大效果。
科普小点子
2015-11-27 · 专注国内各媒体广告投放
科普小点子
采纳数:647 获赞数:1423

向TA提问 私信TA
展开全部
火车头采集器的采集规则太复杂啦
我第一次接触的时候也是研究了很碰腊久都没采集到我需培吵差要的数据内容
建议你试试八爪鱼采集器吧,相配皮比要简单很多,而且还是 免费的,各种数据都能采集。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式