请问如何提取网页源代码指定内容(最好用批处理)?
这是网页的源代码的一部分:<divclass=\"WB_handle\">\r\n<ulclass=\"WB_row_lineWB_row_r4clearfixS_lin...
这是网页的源代码的一部分:
<div class=\"WB_handle\">\r\n <ul class=\"WB_row_line WB_row_r4 clearfix S_line2\">\r\n <li>\r\n <a class=\"S_txt2\" suda-data=\"key=smart_feed&value=time_sort_collect\" href=\"javascript:void(0);\" diss-data=\"fuid=2373239217\" action-type=\"fl_favorite\" ><span class=\"pos\"><span class=\"line S_line1\">收藏<\/span><\/span><\/a>\r\n <\/li>\r\n <li>\r\n <a action-data=\"allowForward=1&url=http:\/\/weibo.com\/2373239217\/C6Sumb894&mid=3816394262652922&name=Flippedgame&uid=2373239217&domain=2373239217\" action-type=\"fl_forward\" action-history=\"rec=1\" href=\"javascript:void(0);\" suda-uatrack=\"key=aggregate_page_feed&value=transmit:3816394262652922\" class=\"S_txt2\"><span class=\"pos\"><span class=\"line S_line1\" node-type=\"forward_btn_text\">转发<\/span><\/span><\/a>\r\n <\/li>\r\n <li >\r\n
以上只是网页源代码的部分内容。但基本上就像那样,里面有空格之类。有些一行会有点长。可能有上千字符。
要提取的是像
&name=Flippedgame&uid=2373239217
里的Flippedgame,也就是name与uid之间的内容(=和&有没有都可以)
像&name=xxxxxxx&uid=2373239217的字段不止一处,但每一个这样的字段不会内容在多行,都在一行里面,不会出现
&name=xxxxxxx&ui
d=2373239217
这样的情况。
提取出来之后,把每一个内容提行保存在一个txt中,就像:
xxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxx
xxx
xxxxxxxx
最好用批处理实现。谢谢!!! 展开
<div class=\"WB_handle\">\r\n <ul class=\"WB_row_line WB_row_r4 clearfix S_line2\">\r\n <li>\r\n <a class=\"S_txt2\" suda-data=\"key=smart_feed&value=time_sort_collect\" href=\"javascript:void(0);\" diss-data=\"fuid=2373239217\" action-type=\"fl_favorite\" ><span class=\"pos\"><span class=\"line S_line1\">收藏<\/span><\/span><\/a>\r\n <\/li>\r\n <li>\r\n <a action-data=\"allowForward=1&url=http:\/\/weibo.com\/2373239217\/C6Sumb894&mid=3816394262652922&name=Flippedgame&uid=2373239217&domain=2373239217\" action-type=\"fl_forward\" action-history=\"rec=1\" href=\"javascript:void(0);\" suda-uatrack=\"key=aggregate_page_feed&value=transmit:3816394262652922\" class=\"S_txt2\"><span class=\"pos\"><span class=\"line S_line1\" node-type=\"forward_btn_text\">转发<\/span><\/span><\/a>\r\n <\/li>\r\n <li >\r\n
以上只是网页源代码的部分内容。但基本上就像那样,里面有空格之类。有些一行会有点长。可能有上千字符。
要提取的是像
&name=Flippedgame&uid=2373239217
里的Flippedgame,也就是name与uid之间的内容(=和&有没有都可以)
像&name=xxxxxxx&uid=2373239217的字段不止一处,但每一个这样的字段不会内容在多行,都在一行里面,不会出现
&name=xxxxxxx&ui
d=2373239217
这样的情况。
提取出来之后,把每一个内容提行保存在一个txt中,就像:
xxxxxxx
xxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxx
xxxxxxxxxxxxxxxxxxxxxx
xxx
xxxxxxxx
最好用批处理实现。谢谢!!! 展开
展开全部
就是一个采集工具了。建议安装个采集软件试下,破解版的火车头
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
已经私信给你答案。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
批处理不好弄,用php正则处理
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询