请问如何提取网页源代码指定内容(最好用批处理)?

这是网页的源代码的一部分:<divclass=\"WB_handle\">\r\n<ulclass=\"WB_row_lineWB_row_r4clearfixS_lin... 这是网页的源代码的一部分:

<div class=\"WB_handle\">\r\n <ul class=\"WB_row_line WB_row_r4 clearfix S_line2\">\r\n <li>\r\n <a class=\"S_txt2\" suda-data=\"key=smart_feed&value=time_sort_collect\" href=\"javascript:void(0);\" diss-data=\"fuid=2373239217\" action-type=\"fl_favorite\" ><span class=\"pos\"><span class=\"line S_line1\">收藏<\/span><\/span><\/a>\r\n <\/li>\r\n <li>\r\n <a action-data=\"allowForward=1&url=http:\/\/weibo.com\/2373239217\/C6Sumb894&mid=3816394262652922&name=Flippedgame&uid=2373239217&domain=2373239217\" action-type=\"fl_forward\" action-history=\"rec=1\" href=\"javascript:void(0);\" suda-uatrack=\"key=aggregate_page_feed&value=transmit:3816394262652922\" class=\"S_txt2\"><span class=\"pos\"><span class=\"line S_line1\" node-type=\"forward_btn_text\">转发<\/span><\/span><\/a>\r\n <\/li>\r\n <li >\r\n

以上只是网页源代码的部分内容。但基本上就像那样,里面有空格之类。有些一行会有点长。可能有上千字符。
要提取的是像
&name=Flippedgame&uid=2373239217
里的Flippedgame,也就是name与uid之间的内容(=和&有没有都可以)
像&name=xxxxxxx&uid=2373239217的字段不止一处,但每一个这样的字段不会内容在多行,都在一行里面,不会出现
&name=xxxxxxx&ui
d=2373239217
这样的情况。
提取出来之后,把每一个内容提行保存在一个txt中,就像:
xxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxx
xxx
xxxxxxxx
最好用批处理实现。谢谢!!!
展开
 我来答
CPU风扇
2015-03-28 · 超过16用户采纳过TA的回答
知道答主
回答量:39
采纳率:0%
帮助的人:11.6万
展开全部

正则表达式可以满足你的要求。

你可以百度搜索“在线正则表达式测试”。

然后在匹配文本框中把你的网页复制粘贴进去,然后表达式填:\bname=\b.*\b\uid=\b\d+

然后点匹配测试即可得出你想要的结果


fly2084
高能答主

2015-03-14 · 有什么不懂的尽管问我
知道大有可为答主
回答量:4.1万
采纳率:83%
帮助的人:6444万
展开全部
就是一个采集工具了。建议安装个采集软件试下,破解版的火车头
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
苔花静开
2015-03-21 · 超过19用户采纳过TA的回答
知道答主
回答量:63
采纳率:0%
帮助的人:33.3万
展开全部
已经私信给你答案。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
活宝奥利弗
2015-04-01
知道答主
回答量:23
采纳率:0%
帮助的人:6.8万
展开全部
批处理不好弄,用php正则处理
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 2条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式