3月242016
au3 正则参考 -08-Unicode 类-块
<!DOCTYPE html>
匹配 Unicode 类别或块: \p{名称}
匹配属于 Unicode 常规类别或命名块的任何字符, 其中名称是类别缩写或命名块的名称.
下面的示例使用 \p{名称} 构造以匹配 Unicode 常规类别(示例中 Pd 为短划线).
字符串: Κατα Μαθθαίον - The Gospel of Matthew
表达式: \p{Greek}+(\s)?(\p{Greek}+(\s)?)+\p{Pd}\s\p{Latin}+(\s)?(\p{Latin}+(\s)?)+
匹配结果(标志 2):
[0]Κατα Μαθθαίον - The Gospel of Matthew
[1]
[2]Μαθθαίον
[3]
[4]
[5]Matthew
[6]
其中 [1], [3], [4], [6] 为空白子符.
表达式分析:
模式 | 说明 |
---|---|
\p{Greek}+ | 匹配一个或多个希腊语字符. |
(\s)? | 匹配零个或一个空白字符. |
(\p{Greek}+(\s)?)+ | 匹配一个或多个希腊语字符后跟零个或一个空白字符集合的一次或多次. |
\p{Pd} | 匹配短划线字符. |
\s | 匹配空白字符. |
\p{Latin}+ | 匹配一个或多个基本拉丁字符. |
(\s)? | 匹配零个或一个空白字符. |
(\p{Latin}+(\s)?)+ | 匹配一个或多个基本拉丁字符后跟零个或一个空白字符模式的一次或多次. |
匹配非 Unicode 类别或块: \P{}
下面的示例使用 \P{名称} 构造来从数字字符串中删除任何货币符号(在该示例中 Sc 为货币符号标记).
字符串: $164,091.78, £1,073,142.68, €73, €120
表达式: (\P{Sc})+
匹配结果(标志 4):
[0]=> [0]164,091.78,
[1]=> [0]1,073,142.68,
[2]=> [0]73,
[3]=> [0]120
正则表达式模式 (\P{Sc})+ 匹配不为货币符号的一个或多个字符, 它能有效地从结果字符串中抽出任何货币符号.
扫描二维码,在手机上阅读
发表评论
木有头像就木JJ啦!还木有头像吗?点这里申请属于你的个性Gravatar头像吧!