
正则表达式内容是某个网站的html代码。截取内容看下面
例如源码:<body><div><divid="aaa">这是一个表情</div><divid=“bb”>这是b<font>font</font></div></div>...
例如 源码:
<body>
<div>
<div id="aaa">这是一个表情</div> <div id=“bb”>这是b<font>font</font></div>
</div>
</body>
给定条件是:
<div id="aaa"> 和</div>
设计正则表达式只匹配出结果:<div id="aaa">这是一个表情</div>
而不是:
<div id="aaa">这是一个表情</div> <div id=“bb”>这是b<font>font</font></div>
</div>
其实就是最近匹配。
谢谢! 展开
<body>
<div>
<div id="aaa">这是一个表情</div> <div id=“bb”>这是b<font>font</font></div>
</div>
</body>
给定条件是:
<div id="aaa"> 和</div>
设计正则表达式只匹配出结果:<div id="aaa">这是一个表情</div>
而不是:
<div id="aaa">这是一个表情</div> <div id=“bb”>这是b<font>font</font></div>
</div>
其实就是最近匹配。
谢谢! 展开
2个回答
展开全部
小弟最近也在纠结这个问题
楼主这问题用懒惰匹配就可以了
<div id=\"aaa\"(.*?)<\/div>
也就是在* 后加一个问号
要完美解决这问题还要考虑跨行匹配的情况,而php的函数eregi支持跨行却不能懒惰,preg_mach支持懒惰却不支持换行。。。
只好先把换行换成某个字符,在输出结果里再改回来。。。
<?php
$url="http://www.baidu.com";
$content=file_get_contents($url);
$content=str_replace("\n","#",$content);
if(preg_match("/<div id=\"aaa\"(.*?)<\/div>/",$content,$result))
{
$result[0]=str_replace("#","\n",$result[0]);
echo $result[0];
}
?>
楼主这问题用懒惰匹配就可以了
<div id=\"aaa\"(.*?)<\/div>
也就是在* 后加一个问号
要完美解决这问题还要考虑跨行匹配的情况,而php的函数eregi支持跨行却不能懒惰,preg_mach支持懒惰却不支持换行。。。
只好先把换行换成某个字符,在输出结果里再改回来。。。
<?php
$url="http://www.baidu.com";
$content=file_get_contents($url);
$content=str_replace("\n","#",$content);
if(preg_match("/<div id=\"aaa\"(.*?)<\/div>/",$content,$result))
{
$result[0]=str_replace("#","\n",$result[0]);
echo $result[0];
}
?>
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询