怎么从html源码中获取URL链接
4个回答
2018-07-27 · 百度知道合伙人官方认证企业
育知同创教育
1【专注:Python+人工智能|Java大数据|HTML5培训】 2【免费提供名师直播课堂、公开课及视频教程】 3【地址:北京市昌平区三旗百汇物美大卖场2层,微信公众号:yuzhitc】
向TA提问
关注
展开全部
从html源码中获取URL链接的方法是写正则表达式处理。
举例:PHP获取页面中的所有链接
function getPageLink($url){
// 获取源文件的内容
$html=file_get_contents($url);
//编写正则表达式,匹配所有a标签内部的http连接
preg_match_all("/<a(s*[^>]+s*)href=([\"|']?)([^\"'>\s]+)([\"|']?)/ies",$html,$out);
// 匹配到的链接存入数组out
$arrLink=$out[3];
//解析链接
$arrUrl=parse_url($url);
// 返回链接
return $arrUrl;
}
举例:PHP获取页面中的所有链接
function getPageLink($url){
// 获取源文件的内容
$html=file_get_contents($url);
//编写正则表达式,匹配所有a标签内部的http连接
preg_match_all("/<a(s*[^>]+s*)href=([\"|']?)([^\"'>\s]+)([\"|']?)/ies",$html,$out);
// 匹配到的链接存入数组out
$arrLink=$out[3];
//解析链接
$arrUrl=parse_url($url);
// 返回链接
return $arrUrl;
}
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2016-07-04 · 百度知道合伙人官方认证企业
兄弟连教育
兄弟连教育成立于2006年,11年来专注IT职业教育,是国内专业的IT技术培训学校。2016年成功挂牌新三板(股票代码:839467)市值过亿。开设专注程序员培训专注php、Java、UI、云计算、Python、HTML5、
向TA提问
关注
展开全部
网页的html源码我已经获取到 我保存到了一个byte[] result 中,下面是html源码的部分片段:
{"thumbURL":"http://t10.baidu.com/it/u=3544188057,2509466519&fm=59",
"middleURL":"",
"largeTnImageUrl":"http://t12.baidu.com/it/u=3443469662,2393181290&fm=59",
"hasLarge" : 0,
"hoverURL":"http://t10.baidu.com/it/u=3513786075,2475270877&fm=59",
"pageNum":16,
"o
{"thumbURL":"http://t10.baidu.com/it/u=3544188057,2509466519&fm=59",
"middleURL":"",
"largeTnImageUrl":"http://t12.baidu.com/it/u=3443469662,2393181290&fm=59",
"hasLarge" : 0,
"hoverURL":"http://t10.baidu.com/it/u=3513786075,2475270877&fm=59",
"pageNum":16,
"o
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
我去这是服务器后台生成的网页。你在前端查看源码只能看到静态的。你要下载那个文件可以试试抓取软件。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询