正则表达式匹配网页

有如下网页内容，<\/br><\/br>1、学号名字年龄0025李华天16114<\/br><\/br>考试1语文数学<\/br>(1)月考8590<\/br>(2)期中... 有如下网页内容，

<\/br><\/br>1、学号名字年龄 0025 李华天 161 14 <\/br><\/br> 考试1 语文数学 <\/br>(1)月考 85 90 <\/br>(2)期中考试 83 85<\/br>(3)期末考试 80 78<\/br><\/br>考试2 语文均分数学均分 <\/br>(1)期中考试 80 81<\/br>(2)期末考试 70 75<\/br><\/br> 2、学号名字身高年龄 0026 秦雪涛 14.......

想得到的结果：
学号考试成绩1 语文数学考试成绩2 语文均分数学均分
0025 月考 85 90 期中考试 80 81
0025 期中考试 83 85 期末考试 70 75
0025 期末考试 80 78

其中考试1和考试2中(1),(2),(3)的条数不一定，可能还有(4),(5)，也可能只有(1),(2);最后'.......'后面的与前面一段内容都一致，都是这种格式展开

 我来答

2个回答

#热议# 什么是淋病？哪些行为会感染淋病？

司马刀剑

高粉答主

2018-03-16 · 每个回答都超有意思的

知道顶级答主

回答量：4.6万

采纳率：93%

帮助的人：7569万

我也去答题访问个人页

关注

展开全部

如果你要<div class="nav" monkey="nav">和<div class="head-ad">之间的所有源码，用 preg_match 就可以，不用preg_match_all ，如果你要里面的所有的 <li></li>标签中的内容，可以用preg_match_all

//提取所有代码
$pattern = '/<div class="nav" monkey="nav">(.+?)<div class="head-ad">/is';
preg_match($pattern, $string, $match);
//$match[0] 即为<div class="nav" monkey="nav">和<div class="head-ad">之间的所有源码
echo $match[0];

//然后再提取<li></li>之间的内容
$pattern = '/<li.*?>(.+?)<\/li>/is';

preg_match_all($pattern, $match[0], $results);
$new_arr=array_unique($results[0]);

foreach($new_arr as $kkk){
echo $kkk;

}

已赞过 已踩过<

评论收起

不想起名字了99
2018-01-24 · TA获得超过1695个赞

知道大有可为答主

回答量：2708

采纳率：76%

帮助的人：728万

我也去答题访问个人页

关注

展开全部

这个用正则不是正途，应该用XML对象来分析

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

正规表达式-4.0Turbo-国内入口

ppt生成、文本润色、翻译、文档阅读、写文案、写代码、写论文等API直连，集成12家知名企业大语言模型

chat.moshuai.co广告

正则表达式匹配网页

您可能关注的内容

其他类似问题

为你推荐：