PHP正则表达式急求:如何提取字符串中的SCRIPT脚本中的代码内容?
有一个HTML文件,其内容为:==========================================================<!DOCTYPEHTM...
有一个HTML文件,其内容为:
==========================================================
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>无标题文档</title>
</head>
<script>
function xyz(){
alert(2);
}
</script>
<script type="text/javascript">
function mnl(){
alert(2);
}
</script>
<script language="javascript">function abc(id){
alert(id);
}
</script>
<body>
</body>
</html>
=======================================
现在要用PHP提取其中<script 到</script>中间的内容,正则表达式怎么写? 展开
==========================================================
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>无标题文档</title>
</head>
<script>
function xyz(){
alert(2);
}
</script>
<script type="text/javascript">
function mnl(){
alert(2);
}
</script>
<script language="javascript">function abc(id){
alert(id);
}
</script>
<body>
</body>
</html>
=======================================
现在要用PHP提取其中<script 到</script>中间的内容,正则表达式怎么写? 展开
展开全部
核心正则是:/<script([\w\W]*)<\/script>/iU
下面是测试代码:
<?php
$str = <<<EOD
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>无标题文档</title>
</head>
<script>
function xyz(){
alert(2);
}
</script>
<script type="text/javascript">
function mnl(){
alert(2);
}
</script>
<script language="javascript">function abc(id){
alert(id);
}
</script>
<body>
</body>
</html>
EOD;
//echo $str;
$result = array();
if(preg_match_all( '/<script([\w\W]*)<\/script>/iU', $str, $result) )
{
//print_r($result);
for( $i = 0; $i<count($result[1]); $i++)
{
var_dump( $result[1][$i] );
echo '<hr>';
}
}
?>
下面是测试代码:
<?php
$str = <<<EOD
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<title>无标题文档</title>
</head>
<script>
function xyz(){
alert(2);
}
</script>
<script type="text/javascript">
function mnl(){
alert(2);
}
</script>
<script language="javascript">function abc(id){
alert(id);
}
</script>
<body>
</body>
</html>
EOD;
//echo $str;
$result = array();
if(preg_match_all( '/<script([\w\W]*)<\/script>/iU', $str, $result) )
{
//print_r($result);
for( $i = 0; $i<count($result[1]); $i++)
{
var_dump( $result[1][$i] );
echo '<hr>';
}
}
?>
追问
能给解释下中间的\w\W是社么意思吗?谢谢!
追答
\w 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]”。
\W 匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。
这样\w\W就可以匹配任何字了...
你也可以用\s\S的
本回答被提问者采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询