正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式为文本处理提供了强大的功能。Go作为一门通用语言,自然提供了对正则表达式的支持。
regexp
包实现了正则表达式搜索。
正则表达式采用RE2语法(除了\c、\C),和Perl、Python等语言的正则基本一致。确切地说是兼容 RE2
语法。相关资料:http://code.google.com/p/re2/wiki/Syntax,包:regexp/syntax
注意:regexp
包的正则表达式实现保证运行时间随着输入大小线性增长的(即复杂度为O(n),其中n为输入的长度),这一点,很多正则表达式的开源实现无法保证,参见:RSC 的 《Regular Expression Matching Can Be Simple And Fast
(but is slow in Java, Perl, PHP, Python, Ruby, ...)》
另外,所有的字符都被视为utf-8编码的码值(Code Point)。
Regexp类型提供了多达16个方法,用于匹配正则表达式并获取匹配的结果。它们的名字满足如下正则表达式:
Find(All)?(String)?(Submatch)?(Index)?
未完待续。。。