java 解析html 提取超链接,然后将超链接存储到文本中

 我来答
wydykbh
2011-07-25
知道答主
回答量:12
采纳率:0%
帮助的人:16.2万
展开全部
html源文件里超文本引用(hypertext reference)也叫超链接都是有特殊的标签的有不有。
举个例子:href="http://zhidao.baidu.com/question/158971081.html" 格式都是这样的有木有。
你可以在网页空白处右击选择 查看源文件 然后自己看看每个超链接都是上面的格式有木有。
如果要自己写java程序的话,建议
1.先读取一个html的源文件
2.然后用上面朋友的建议,用正规表达式来识别。
也可以自己找专门的html分析工具哦。
追问
有没有具体的代码啊急用啊兄弟
追答
兄弟实在帮不了你啊。我也没有找到现成的java代码。
不提供两个建议:
1、C#的类似程序的源代码(链接:http://tech.ccidnet.com/art/1110/20040422/868333_1.html
2、使用附加的java开发包htmlparser。利用htmlparser里提供的API可以直接提取网页里的超链接。(详细请看链接:http://zhidao.baidu.com/question/195627372.html
水族箱过滤
2011-07-25 · TA获得超过552个赞
知道小有建树答主
回答量:583
采纳率:0%
帮助的人:179万
展开全部
晕 你想搞蜘蛛程序呀 这个要用到正则表达式,判断需要的内容是否合适。然后保存起来。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式