排行榜 统计
  • 文章总数:649 篇
  • 评论总数:10704 条
  • 分类总数:4 个
  • 最后更新:4月4日
none

正则表达式语法-正则表达式基本语法

本文阅读 3 分钟
首页 正文
本文最后更新于2022年11月09日,已超过907天没有更新。如果文章内容或图片资源失效,请留言反馈,我会及时处理,谢谢!

您阅读这篇文章共耗时:

  [正则表达式]1是一种字符串匹配模式或者规则,它可以用来检索、替换那些符合特定规则的文本。正则表达式几乎适用于所有编程语言,无论是前端语言 ,还是诸如许多后端语言,比如 Python、Java、C# 等,这些语言都提供了相应的函数、模块来支持正则表达式,比如 Python 的 re 模块就提供了正则表达式的常用方法。

  在使用 Python 编写爬虫的过程中,re 模块通常做为一种解析方法来使用。通过审查网页元素来获取网页的大体结构正则表达式语法,然后使用解析模块来提取你想要的网页信息,最终实现数据的抓取。本节对正则表达式基本语法做简单讲解。

  注意:学习本节知识之前,您应该已经掌握了正则表达式的使用方法。

  正则表达式元字符

  下表列出了常用的正则表达式元字符:

  1) 元字符

  2) 量词

  3) 字符组

  有时也会出现各种字符组成的字符组,这在正则表达式中使用[]表示,如下所示:

  贪婪模式非贪婪模式

  正则表达式默认为贪婪匹配,也就是尽可能多的向后匹配字符,比如 {n,m} 表示匹配前面的内容出现 n 到 m 次(n 小于 m),在贪婪模式下,首先以匹配 m 次为目标,而在非贪婪模式是尽可能少的向后匹配内容,也就是说匹配 n 次即可。

  贪婪模式转换为非贪婪模式的方法很简单,在元字符后添加“?”即可实现正则表达式语法,如下所示:

  非贪婪模式

  正则表达式转义

  如果使用正则表达式匹配特殊字符时,则需要在字符前加\表示转意。常见的特殊字符如下:

  * + ? ^ $ [] () {} | \

本文来自投稿,不代表本站立场,如若转载,请注明出处:http://xuan.ddwoo.top/index.php/archives/151/
-- 展开阅读全文 --
罗丹明b浓度偏低-范德生物科技公司
« 上一篇 11-09
qam调制信号功率-未来,无线信号的设计权将由人类转向人工智能
下一篇 » 11-09
------本页内容已结束,喜欢请分享------

感谢您的来访,获取更多精彩文章请收藏本站。

发表评论

本站已加入互联网信息服务许可,请规范您的言行哦~

成为第一个评论的人

作者信息

热门文章

珍惜时间哦~

今日一言

- -
加载中...
换一句

标签TAG

热评文章