博客
关于我
正则表达式的基本用法
阅读量:668 次
发布时间:2019-03-15

本文共 884 字,大约阅读时间需要 2 分钟。

正则表达式的基本用法

正则表达式是一种强大的工具,用来匹配一系列符合特定规则的字符串。它可以通过单个字符串描述一系列复杂的文本内容模式。

正则表达式的基本字符

原义字符包括字母、数字、符号以及特殊控制字符(如换行符、制表符等),这些字符通常都可以直接使用。例如:abc\n表示换行符。

元字符是一些具有特殊含义的符号,需要特定的处理方式。这些符号用于改变匹配模式的行为,常见的元字符包括: *(零或多次重复)、+(一次或多次重复)、?(零或一次)、\$(字符串末尾)、\^(字符串开头)等。

正则表达式的分类

字符类:用于将字符分组表示,系统内部同一组的清单

[abc]表示匹配a、b或c中的任意一个字符,而[^abc]则表示任何不在a、b、c中的字符。例如:^[a-z]$匹配一个长度为一个的字母;^[^a-z]匹配一个非字母字符。

范围类:表示字符的范围

[a-z]匹配一个大写字母,从a到z;[0-9]匹配一个数字字符。这些短写用途方便了编写表达式,例如:\d(数字),\D(非数字)。

预定义类:正则表达式中提供了一些预定义的字符类,简化了表达。例如:\s匹配任意空白字符(包括空格、制表符、换行等),\S则匹配非空白字符。同样,\w匹配单词字符(字母、数字、下划线),\W则匹配非单词字符。

.表示任意字符,除了换行符外还可能包含其他控制字符。通常会使用[. 韬]来明确表示包括换行符,但默认情况下.在多数引擎中不匹配换行符。

边界字符主要用于限定匹配的位置。例如,^表示匹配字符串的开头,$表示匹配字符串的结尾。为了更精确地控制单词边界,\b用来表示单词边界(字母与非字母位置的转换),\B表示非单词边界位置。例如:a\b表示两字以内以a结尾,而a\B表示a后面不是单词边界的位置。需要注意的是,这些边界在不同的引擎中有不同的实现方式和特性,需要根据具体需求选择合适的符号。

此外,正则表达式还支持使用括号(...)来创建子表达式。括号允许我们分割表达式,形成独立的子表达式,并在替换时以变量形式引用。例如,可以将日期格式转换成自定义格式的例子如下:

转载地址:http://isemz.baihongyu.com/

你可能感兴趣的文章
memcache、redis原理对比
查看>>
memset初始化高维数组为-1/0
查看>>
Metasploit CGI网关接口渗透测试实战
查看>>
Metasploit Web服务器渗透测试实战
查看>>
MFC模态对话框和非模态对话框
查看>>
Moment.js常见用法总结
查看>>
MongoDB出现Error parsing command line: unrecognised option ‘--fork‘ 的解决方法
查看>>
mxGraph改变图形大小重置overlay位置
查看>>
MongoDB可视化客户端管理工具之NoSQLbooster4mongo
查看>>
Mongodb学习总结(1)——常用NoSql数据库比较
查看>>
MongoDB学习笔记(8)--索引及优化索引
查看>>
mongodb定时备份数据库
查看>>
mppt算法详解-ChatGPT4o作答
查看>>
mpvue的使用(一)必要的开发环境
查看>>
MQ 重复消费如何解决?
查看>>
mqtt broker服务端
查看>>
MQTT 保留消息
查看>>
MQTT 持久会话与 Clean Session 详解
查看>>
MQTT工作笔记0007---剩余长度
查看>>
MQTT工作笔记0009---订阅主题和订阅确认
查看>>