如何用正则表达式筛选html中表格中的数据

现在可以拿到图中的html代码怎么做才能得到其中的有效数据啊。我不怎么会写正则表达式。。。... 现在可以拿到图中的html代码 怎么做才能得到其中的有效数据啊。我不怎么会写正则表达式。。。 展开
 我来答
丿占戈灬龙哥
2016-06-13 · 知道合伙人软件行家
丿占戈灬龙哥
知道合伙人软件行家
采纳数:479 获赞数:1174

向TA提问 私信TA
展开全部
正则表达式
<(\S*?) [^>]*>.*?</\1>|<.*? />

匹配
<html>hello</html>|<a>abcd</a>

不匹配
abc|123|<html>ddd

正则表达式
^[^<>`~!/@\#}$%:;)(_^{&*=|'+]+$

匹配
This is a test

不匹配
<href = | <br> | That's it

正则表达式
<!--.*?-->

匹配
<!-- <h1>this text has been removed</h1> --> | <!-- yada -->

不匹配
<h1>this text has not been removed</h1>

正则表达式
(\[(\w+)\s*(([\w]*)=('|")?([a-zA-Z0-9|:|\/|=|-|.|\?|&]*)(\5)?)*\])([a-zA-Z0-9|:|\/|=|-|.|\?|&|\s]+)(\[\/\2\])

匹配
[link url="http://www.domain.com/file.extension?getvar=value&secondvar=value"]Link[/li

不匹配
[a]whatever[/b] | [a var1=something var2=somethingelse]whatever[/a] | [a]whatever[a]

正则表达式
href=[\"\'](http:\/\/|\.\/|\/)?\w+(\.\w+)*(\/\w+(\.\w+)?)*(\/|\?\w*=\w*(&\w*=\w*)*)?[\"\']

匹配
href="www.yahoo.com" | href="http://localhost/blah/" | href="eek"

不匹配
href="" | href=eek | href="bad example"

正则表达式
"([^"](?:\\.|[^\\"]*)*)"

匹配
"This is a \"string\"."

不匹配
"This is a \"string\".

正则表达式
(?i:on(blur|c(hange|lick)|dblclick|focus|keypress|(key|mouse)(down|up)|(un)?load|mouse(move|o(ut|ver))|reset|s(elect|ubmit)))

匹配

onclick | onsubmit | onmouseover

不匹配
click | onandon | mickeymouse

正则表达式
(?s)/\*.*\*/

匹配
/* .................... */ | /* imagine lots of lines here */

不匹配
*/ malformed opening tag */ | /* malformed closing tag /*

正则表达式
<(\S*?) [^>]*>.*?</\1>|<.*? />

匹配
<html>hello</html>|<a>abcd</a>

不匹配
abc|123|<html>ddd

正则表达式
\xA9

匹配
©

不匹配
anything

正则表达式
src[^>]*[^/].(?:jpg|bmp|gif)(?:\"|\')

匹配
src="../images/image.jpg" | src="http://domain.com/images/image.jpg" | src='d:\w

不匹配
src="../images/image.tif" | src="cid:value"

正则表达式
/\*[\d\D]*?\*/

匹配
/* my comment */ | /* my multiline comment */ | /* my nested comment */

不匹配
*/ anything here /* | anything between 2 seperate comments | \* *\

正则表达式
<[a-zA-Z]+(\s+[a-zA-Z]+\s*=\s*("([^"]*)"|'([^']*)'))*\s*/>

匹配
<img src="test.gif"/>

不匹配
<img src="test.gif"> | <img src="test.gif"a/>
匿名用户
2016-06-14
展开全部

你这表里哪些算是有效数据呢??

而且,这个直接用$("xx").text()就可以筛选了吧。不需要正则。


如果这是一段文本,而不是dom

可以试试。

var str = "上面文本";
var reg = /<span.*>(.*)<\/span>/g;
var ll = str.match(reg);
var arr=[];
while(reg.exec(str)!=null){
arr.push(RegExp.$1+"\n");
}
console.log(arr)
本回答被网友采纳
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
匿名用户
2016-06-14
展开全部
OMG直接打开是乱码,查看源文件 看到 有几个人名,到底是提取哪些信息?
人名+?+?
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
收起 1条折叠回答
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式