博客
关于我
正则表达式的基本用法
阅读量:668 次
发布时间:2019-03-15

本文共 884 字,大约阅读时间需要 2 分钟。

正则表达式的基本用法

正则表达式是一种强大的工具,用来匹配一系列符合特定规则的字符串。它可以通过单个字符串描述一系列复杂的文本内容模式。

正则表达式的基本字符

原义字符包括字母、数字、符号以及特殊控制字符(如换行符、制表符等),这些字符通常都可以直接使用。例如:abc\n表示换行符。

元字符是一些具有特殊含义的符号,需要特定的处理方式。这些符号用于改变匹配模式的行为,常见的元字符包括: *(零或多次重复)、+(一次或多次重复)、?(零或一次)、\$(字符串末尾)、\^(字符串开头)等。

正则表达式的分类

字符类:用于将字符分组表示,系统内部同一组的清单

[abc]表示匹配a、b或c中的任意一个字符,而[^abc]则表示任何不在a、b、c中的字符。例如:^[a-z]$匹配一个长度为一个的字母;^[^a-z]匹配一个非字母字符。

范围类:表示字符的范围

[a-z]匹配一个大写字母,从a到z;[0-9]匹配一个数字字符。这些短写用途方便了编写表达式,例如:\d(数字),\D(非数字)。

预定义类:正则表达式中提供了一些预定义的字符类,简化了表达。例如:\s匹配任意空白字符(包括空格、制表符、换行等),\S则匹配非空白字符。同样,\w匹配单词字符(字母、数字、下划线),\W则匹配非单词字符。

.表示任意字符,除了换行符外还可能包含其他控制字符。通常会使用[. 韬]来明确表示包括换行符,但默认情况下.在多数引擎中不匹配换行符。

边界字符主要用于限定匹配的位置。例如,^表示匹配字符串的开头,$表示匹配字符串的结尾。为了更精确地控制单词边界,\b用来表示单词边界(字母与非字母位置的转换),\B表示非单词边界位置。例如:a\b表示两字以内以a结尾,而a\B表示a后面不是单词边界的位置。需要注意的是,这些边界在不同的引擎中有不同的实现方式和特性,需要根据具体需求选择合适的符号。

此外,正则表达式还支持使用括号(...)来创建子表达式。括号允许我们分割表达式,形成独立的子表达式,并在替换时以变量形式引用。例如,可以将日期格式转换成自定义格式的例子如下:

转载地址:http://isemz.baihongyu.com/

你可能感兴趣的文章
PCI Express学习篇:Power Management(二)
查看>>
pcie握手机制_【博文连载】PCIe扫盲——Ack/Nak 机制详解(一)
查看>>
pcm转wav的方法及代码示例
查看>>
PC史上最悲剧的16次失败
查看>>
PC端恶意代码分析Lab1.1-5.1,从零基础到精通,收藏这篇就够了!
查看>>
PC端稳定性测试探索
查看>>
PC端编辑 但能在PC端模拟移动端预览的富文本编辑器
查看>>
PDB文件:每个开发人员都必须知道的
查看>>
springMVC学习(二)
查看>>
Pdfkit页眉和页脚
查看>>
PDF中的Pandoc语法突出显示不起作用
查看>>
pdf从结构新建书签_在PDF文件中怎样创建书签
查看>>
pdf做成翻页电子书_第一弹:常见BOOX电子书阅读器问题解答,这些技能你都会吗?...
查看>>
PDF工具箱-分割提取合并
查看>>
pdf打印骑缝章
查看>>
PDF文字识/编辑?这个工具真的很强大!
查看>>
pdf文档出现乱码如何修改
查看>>
pdf根据模板导出
查看>>
PDF调出本来存在的书签面板
查看>>
pdf转图片
查看>>