<[^>]*>| |\[[0-9]\]|\s*
解释:
正则表达式中,符号 | 表示“或者”关系
此正则有三个 | 符号,被分成了4部分,表示匹配这四者任意一个
第一部分:
<[^>]*>
< # 匹配<
[^>]* # 匹配所有非>的字符,星号*表示任意数量
> # 匹配>
综上所述,这里匹配类似html标签<xxx>这样的文本
第二部分:
| | #匹配空格
第三部分:
\[[0-9]\]
\[ # 匹配[
[0-9] # 匹配一位数字0-9
\] # 匹配]
综上,这里匹配类似 [3] 这样被
中括号括起来的数字
第四部分:
\s* # 匹配空格,回车,
制表符……等空白文本,星号*表示任意数量