用PHP正则表达式提取页面内容

我想将http://www.kitco.cn/cn/网站左侧栏"主要金融指数"表格的“原油价格”和页面下部"主要货币黄金价格及与美元汇率"表格中的“人民币汇率”提取出来。... 我想将 http://www.kitco.cn/cn/ 网站左侧栏"主要金融指数"表格的“原油价格”和页面下部"主要货币黄金价格及与美元汇率"表格中的“人民币汇率”提取出来。提“原油价格”我是这样做的：

<?php
$theurl="http://www.kitco.cn/cn/";
if (!($contents = file_get_contents($theurl)))
{
echo 'Could not open URL';
exit;
}
$contents=preg_replace('/<.+?>/', '', $contents)；

if (preg_match('/原油价格\s+\d+\.\d+\b/',$contents,$matches))
{
print "A match was found:".$matches[0];
} else {
print "A match was not found.<br />";
}
?>
可就是提不出来！！
谢谢yeahrahxephon的热情，但你的方法不也不行，因为 $contents=preg_replace('/<.+?>/', '', $contents)；已经将所有的<>标签删除了，又怎么存在 "<td class=\"tableHeader\" align=\"left\">"呢，这是我的理解，不知对不对：）
-------------------------------
对，yeahrahxephon，那就是我想要的结果，但我按你的方法怎么就是不行呢？展开

 我来答

2个回答

#热议# 海关有哪些禁运商品？查到后怎么办？

yeahrahxephon
2009-07-25 · TA获得超过1166个赞

知道小有建树答主

回答量：1192

采纳率：0%

帮助的人：1236万

我也去答题访问个人页

关注

展开全部

<?php
$theurl="http://www.kitco.cn/cn/";
if (!($contents = file_get_contents($theurl)))
{
echo 'Could not open URL';
exit;
}

/*
$contents=preg_replace('/<.+?>/', '', $contents)；
*/

if (preg_match("/<td class=\"tableHeader\" align=\"left\">原油价格([^^]*?)<\/tr>/u",$contents,$matches))
{
print "A match was found:".strip_tags($matches[0]);
} else {
print "A match was not found.<br />";
}
?>

试试这样
------------------------------------
呵呵，上边这段已经把你那行注释掉了，先找到唯一的一段代码，取出来你想要的以后以后，再去掉标签，你运行一下试试
运行结果：
A match was found:原油价格 68.11 +0.95
应该是你想要的结果吧？

已赞过 已踩过<

评论收起

name_best
2009-08-05 · TA获得超过145个赞

知道答主

回答量：50

采纳率：0%

帮助的人：66.6万

我也去答题访问个人页

关注

展开全部

你的程序中的$contents=preg_replace('/<.+?>/', '', $contents)；这一句的分号有问题，是中文的，改成英文的，你的source就跑通了，结果也是你想要的结果。

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

用PHP正则表达式提取页面内容

其他类似问题

为你推荐：