如何用正则抓取天猫商品的促销价?

看了天猫商品的页面源码,里面有两行跟促销价有关的代码:<liclass="tm-price-panel"id="J_StrPriceModBox"></li><licla... 看了天猫商品的页面源码,里面有两行跟促销价有关的代码:
<li class="tm-price-panel" id="J_StrPriceModBox"> </li> <li class="tm-promo-panel" id="J_PromoPrice" data-label="促销"></li>
但是找不到促销价格数字啊,请问该怎么才能抓取到呢?
展开
 我来答
长尾科技
2014-02-22 · TA获得超过551个赞
知道答主
回答量:54
采纳率:0%
帮助的人:35.5万
展开全部

我刚刚看了一下,天猫的确实是这样,没有将最终的促销价格的数字写在网页源代码里,你可以F12查看网页源代码,然后搜索tm-price-panel,这样你就可以进入到一个Javascript文件里,它的价格是在这个JS文件里动态算出来的,我截图截的这个和你的名字有点变化,但原理是一样的,然后你在这里啊一个断点,刷新网页就可以跟踪代码


跟踪到这个地方你就发现真正的价格出来了,在buyPrice后面的变量p里,所以,你要想得到最终促销的价格,光获取到网页的源代码还不够,你还得找到相应的JS然后和网站一样的调用,就行了

百度网友96ffcf7
2015-08-02 · 知道合伙人互联网行家
百度网友96ffcf7
知道合伙人互联网行家
采纳数:22721 获赞数:118724
从事多年网络方面工作,有丰富的互联网经验。

向TA提问 私信TA
展开全部
  1、天猫没有将最终的促销价格的数字写在网页源代码里;
  2、这种源码中看不到的数据,原理上是叫做Ajax,意思是异步脚本加载的,也就是数据不再源代码里面,而是在脚本代码中计算并从服务器中取得;
  3、所以用一般采集软件或者分析源代码是不可能采集到的。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
风与雨的故事
2013-12-30 · TA获得超过405个赞
知道小有建树答主
回答量:359
采纳率:80%
帮助的人:245万
展开全部
你%1000的找错了,我无法帮你。你网页标签外面没数据,也就不会显示价格等信息。

还是给个样本你
<li.*?="促销">(.*?)</li>

\1或者$1提取(.*?)价格信息
网上搜索
Lungo 使用说明及心得 中文api
看了你就知道你上面只是一种布局。内容动态生成的。要结合网页中的脚本找。思路就是这样
追问
天猫的代码里就是没有数据啊,如果有数据的话我就用正则采集了
追答
id="J_PromoPrice"   这个就应该是数据,这种写法真无从下手了。采集也就采集出来J_PromoPrice这几个英文。。。。加密了!
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
惟舞独尊_
2013-12-24
知道答主
回答量:34
采纳率:0%
帮助的人:20万
展开全部
大神啊,不懂技术,我都是用采集器。。。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式