博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
正则表达式学习笔记
阅读量:6957 次
发布时间:2019-06-27

本文共 1636 字,大约阅读时间需要 5 分钟。

最近要帮别人下载电影,但是只能找到种子(你懂得)所以就想写一个爬虫来爬磁力链接,所以去找了些书来看,

同时在这里写点笔记,避免以后自己忘掉也给后来的人留下一点资料。

 

我只做了一点微小的工作 :)

 

^       代表一行的开始

$       代表一行的结束

[…]    正则表达式结构体,“匹配列出的任意字符”

-           连字符,表示范围,[0-9][a-z],只有在字符组内部,连字符才是连字符,如果出现在开头,也代表普通字符。

[^…]   匹配未列出的字符,表示排除,“匹配未列出的字符”

.        匹配任意字符,在字符组中表示普通字符

|       “或” 括号划定范围,gr(a|e)y,在表达式中是普通字符

?    代表可选项,只作用于之前紧邻的元素,无论是否出现匹配都会成功,次数上限1

+    代表之前紧邻的元素出现一次或多次,无法匹配将会失败,最低出现一次

*    代表之前紧邻的元素出现任意多次或不出现,不会失败,

\    转义字符,即让某些元字符变成普通意义的

 

匹配引号内字符串  "[^"]*"

匹配美元金额  \$[0-9]+(\.[0-9][0-9])?

匹配URL  \<http://[-a-z0-9_.:]+/[-a-z0-9_.:@&?=+.!/~*%$]*\.html?\>

匹配时间  (1[012]|[1-9]):[0-5][0-9]

24小时制  [01]?[0-9]|2[0-3]

 

这些是在猫头鹰书上看到的,还有蝙蝠书也看了一下表示觉得可能不适合我,因为我比较考虑c#.net和javaScript里用的。

感觉太老而且不是很懂,接下来看了邮电出版社的正则表达式必知必会

觉得这本要比蝙蝠书和猫头鹰书好的多。

 

略过上面那些又有下面这些元字符

 

[\b]    回退并删除一个字符,即backspace键

\f    换页符

\n    换行符

\r    回车符,\r\n \n\n

\t    制表符

\v    垂直制表符

\s    任何一个空白字符等价于[\f\n\r\t\v]

\S    任何一个非空白字符等价于[^\f\n\r\t\v]

\d    任何一个数字等价于[0-9]

\D    任何一个非数字等价于[^0-9]

\w    任何一个字母数字字符或下划线字符等价于[a-zA-Z0-9_]

\W    任何一个非字母数字字符或下划线字符等价于[^a-zA-Z0-9_]

{最大值,最小值}    控制匹配次数

+? *? {n, }?    非贪婪模式的次数匹配,“匹配尽可能少的字符”

 

后面还有三章吧,感觉太复杂,懒得看了,这些应该已经够用了,所以就没有看

而且发现两本书中有些不一样的地方,

如果读者想学的话,还是推荐正则表达式必知必会,相对简单易懂一些。

 

自写正则:

 

匹配一对<script>标签  <?[^<]*</script>  //会匹配之间的>,慎用

 

收集的精品正则:

 

匹配<img src>图片地址  <img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>

出处:http://www.cnblogs.com/08shiyan/archive/2011/09/01/2161741.html

 

匹配<script>标签  <script[^>]*?>.*?</script>

出处:http://www.cnblogs.com/08shiyan/archive/2011/09/28/2194682.html

 

部分正则:http://www.cnblogs.com/08shiyan/archive/2011/09/28/2194682.html

转载于:https://www.cnblogs.com/Aaxuan/p/6025195.html

你可能感兴趣的文章
排除网络故障的十大真理
查看>>
辉瑞健康药物部联手易传媒 打造大数据管理平台
查看>>
CIO们从云中学到的那些经验教训
查看>>
混合云和多云管理不再难:基础架构即代码来帮忙
查看>>
大数据能否解决城市所面临的环境问题
查看>>
数据库安全需要遵循的8项最佳实践
查看>>
关于HTTP推送的一些问题
查看>>
Spring IoC 学习(2)
查看>>
综合布线系统的设计分析
查看>>
论金融机构采用CDP容灾备份的意义
查看>>
Java性能调优工程的几点建议
查看>>
DI的力量,2017 UBDC全域大数据峰会即将开启
查看>>
数据中心的那些未来技术
查看>>
如何善用产品设计的三个层级
查看>>
如何在Amazon AWS上设置一台Linux服务器
查看>>
网站优化遇到死链怎么合理的处理?
查看>>
全球智慧城市进入快速发展阶段
查看>>
AI 黑客会大规模进军网络安全领域吗?为时尚早,因为太贵了
查看>>
科通芯城康敬伟:不照抄别人美国也没这模式
查看>>
每个平安城市的背后,都需要一个默默付出的“她”!
查看>>