我想用java的正则表达式提取网页正文,但不知道哪里错了,请帮忙看一下这个表达式

<divclass="content-body"id="shareBody">(.*?)</div>,输出group(1),不知道为什么输出的是空白... <div class="content-body" id="shareBody">(.*?)</div>,输出group(1),不知道为什么输出的是空白 展开
 我来答
梦里寻你我他
2013-05-27 · TA获得超过2199个赞
知道大有可为答主
回答量:2171
采纳率:42%
帮助的人:1217万
展开全部

<div\sclass\="content\-body"\sid\="shareBody">(?<value>(\w*))<\/div>



import java.util.regex.*;


// 表达式对象

Pattern p = Pattern.compile("<div\\sclass\\=\"content\\-body\"\\sid\\=\"shareBody\">(?<value>(\\w*))<\\/div>");


// 创建 Matcher 对象

Matcher m = p.matcher("");


// 是否找到匹配

boolean found = m.find();


if( found )

{

    String foundstring = m.group();

    int    beginPos    = m.start();

    int    endPos      = m.end();

}

xiangqinxian
2013-05-27 · TA获得超过233个赞
知道小有建树答主
回答量:362
采纳率:0%
帮助的人:283万
展开全部
工具选择有问题。
规则式主要用于纯粹情况。
建议直接使用xpath。
还有更强的dt-xml,不过API似乎有点。。。
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
百度网友a76627d
2013-05-27 · TA获得超过101个赞
知道小有建树答主
回答量:203
采纳率:100%
帮助的人:119万
展开全部
正则不是写在内容里,而是写在js里面
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
宽带人为0
2013-05-27 · TA获得超过346个赞
知道小有建树答主
回答量:345
采纳率:0%
帮助的人:323万
展开全部
给一个你的测试用的字符串
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 更多回答(2)
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式