正则表达式的基本用法-白红宇

正则表达式的基本用法

阅读量：668 次

发布时间：2019-03-15

本文共 884 字，大约阅读时间需要 2 分钟。

正则表达式的基本用法

正则表达式是一种强大的工具，用来匹配一系列符合特定规则的字符串。它可以通过单个字符串描述一系列复杂的文本内容模式。

正则表达式的基本字符

原义字符包括字母、数字、符号以及特殊控制字符（如换行符、制表符等），这些字符通常都可以直接使用。例如：a、b、c、\n表示换行符。

元字符是一些具有特殊含义的符号，需要特定的处理方式。这些符号用于改变匹配模式的行为，常见的元字符包括： *（零或多次重复）、+（一次或多次重复）、?（零或一次）、\$（字符串末尾）、\^（字符串开头）等。

正则表达式的分类

字符类：用于将字符分组表示，系统内部同一组的清单

[abc]表示匹配a、b或c中的任意一个字符，而[^abc]则表示任何不在a、b、c中的字符。例如：^[a-z]$匹配一个长度为一个的字母；^[^a-z]匹配一个非字母字符。

范围类：表示字符的范围

[a-z]匹配一个大写字母，从a到z；[0-9]匹配一个数字字符。这些短写用途方便了编写表达式，例如：\d（数字），\D（非数字）。

预定义类：正则表达式中提供了一些预定义的字符类，简化了表达。例如：\s匹配任意空白字符（包括空格、制表符、换行等），\S则匹配非空白字符。同样，\w匹配单词字符（字母、数字、下划线），\W则匹配非单词字符。

.表示任意字符，除了换行符外还可能包含其他控制字符。通常会使用[. 韬]来明确表示包括换行符，但默认情况下.在多数引擎中不匹配换行符。

边界字符主要用于限定匹配的位置。例如，^表示匹配字符串的开头，$表示匹配字符串的结尾。为了更精确地控制单词边界，\b用来表示单词边界（字母与非字母位置的转换），\B表示非单词边界位置。例如：a\b表示两字以内以a结尾，而a\B表示a后面不是单词边界的位置。需要注意的是，这些边界在不同的引擎中有不同的实现方式和特性，需要根据具体需求选择合适的符号。

此外，正则表达式还支持使用括号(...)来创建子表达式。括号允许我们分割表达式，形成独立的子表达式，并在替换时以变量形式引用。例如，可以将日期格式转换成自定义格式的例子如下：

转载地址：http://isemz.baihongyu.com/

你可能感兴趣的文章

Objective-C实现DoublyLinkedList双链表算法（附完整源码）