如何用正则抓取天猫商品的促销价?
看了天猫商品的页面源码,里面有两行跟促销价有关的代码:<liclass="tm-price-panel"id="J_StrPriceModBox"></li><licla...
看了天猫商品的页面源码,里面有两行跟促销价有关的代码:
<li class="tm-price-panel" id="J_StrPriceModBox"> </li> <li class="tm-promo-panel" id="J_PromoPrice" data-label="促销"></li>
但是找不到促销价格数字啊,请问该怎么才能抓取到呢? 展开
<li class="tm-price-panel" id="J_StrPriceModBox"> </li> <li class="tm-promo-panel" id="J_PromoPrice" data-label="促销"></li>
但是找不到促销价格数字啊,请问该怎么才能抓取到呢? 展开
2015-08-02 · 知道合伙人互联网行家
关注
展开全部
1、天猫没有将最终的促销价格的数字写在网页源代码里;
2、这种源码中看不到的数据,原理上是叫做Ajax,意思是异步脚本加载的,也就是数据不再源代码里面,而是在脚本代码中计算并从服务器中取得;
3、所以用一般采集软件或者分析源代码是不可能采集到的。
2、这种源码中看不到的数据,原理上是叫做Ajax,意思是异步脚本加载的,也就是数据不再源代码里面,而是在脚本代码中计算并从服务器中取得;
3、所以用一般采集软件或者分析源代码是不可能采集到的。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
你%1000的找错了,我无法帮你。你网页标签外面没数据,也就不会显示价格等信息。
还是给个样本你
<li.*?="促销">(.*?)</li>
\1或者$1提取(.*?)价格信息
网上搜索
Lungo 使用说明及心得 中文api
看了你就知道你上面只是一种布局。内容动态生成的。要结合网页中的脚本找。思路就是这样
还是给个样本你
<li.*?="促销">(.*?)</li>
\1或者$1提取(.*?)价格信息
网上搜索
Lungo 使用说明及心得 中文api
看了你就知道你上面只是一种布局。内容动态生成的。要结合网页中的脚本找。思路就是这样
追问
天猫的代码里就是没有数据啊,如果有数据的话我就用正则采集了
追答
id="J_PromoPrice" 这个就应该是数据,这种写法真无从下手了。采集也就采集出来J_PromoPrice这几个英文。。。。加密了!
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
大神啊,不懂技术,我都是用采集器。。。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询