PHP提取HTML中的文本作为网页描述,去除字符串
$text='<p><spanclass=\"txt-14ft-gray\"style=\"line-height:1.5em;\">熊伟,财富中文网专栏作家,现任《中国...
$text = '<p><span class=\"txt-14 ft-gray\" style=\"line-height:1.5em;\">熊伟,财富中文网专栏作家,现任《中国信息化》杂志执行社长,电子工业出版社研究院首席分析师。微信公号:蛮夷大熊。</span></p><p>类似Facebook学微信、谷歌学百度的现象,未来会越来越多。</p><p><br/></p><p><!--enpproperty<articleid>245007</articleid><date>2015-07-29 21:25:00.0</date><author>熊伟</author><title>抄袭逆转:中国互联网开始为全球提供创新“基因”</title><keyword>抄袭,互联网,创新,Facebook,微信,谷歌,百度</keyword><subtitle></subtitle><introtitle></introtitle><siteid>1</siteid><nodeid>8240<deid><nodename>科技<dename><nodesearchname><desearchname>/enpproperty--><!--enpcontent--> <!--enpcontent--></p><p> 西学东渐,不唯社会理论、自然科学传入,企业模式、管理方法也从西方舶来。这是一个百年历程,延续到以信息社会为面相的新世纪。从西到东,向来如此,直到最近出现一些转向。';
从这提取出纯文本,去除一堆字符串,及图片链接,试了一天也没试成功,实在太菜了,求救啊
不是完全针对该段内容,而且是所有类似网页抓取的HTML内容
实际的字符串是这,有转义字符串 展开
从这提取出纯文本,去除一堆字符串,及图片链接,试了一天也没试成功,实在太菜了,求救啊
不是完全针对该段内容,而且是所有类似网页抓取的HTML内容
实际的字符串是这,有转义字符串 展开
2个回答
展开全部
有一种最好的方法,就是将你搞过来的文件保存到记事本中,然后再取出来就OK了,顶多再去除一个换行符就OK
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询