登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

JDK 7中将支持正则表达式命名捕获组  

2010-04-27 13:27:09|  分类: java-j2ee |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

 

    目前Java的正则表达式不支持命名捕获组功能,只能通过捕获组的计数来访问捕获组。当正则表达式比较复杂的时候,里面含有大量的捕获组和非捕获组,通过从左至右数括号来得知捕获组的计数也是一件很烦人的事情;而且这样做代码的可读性也不好,当正则表达式需要修改的时候也会改变里面捕获组的计数。

    解决这个问题的方法是通过给捕获组命名来解决,就像Python, PHP, .Net 以及Perl这些语言里的正则表达式一样。这个特性Javaer已经期待了很多年,而现在我们终于在JDK7 b50得到了实现。

    新引入的命名捕获组支持如下:

(1) (?X) to define a named group NAME"

(2) \k to backref a named group "NAME"

(3) <$ to reference to captured group in matcher's replacement str

(4) group(String NAME) to return the captured input subsequence by the given "named group"

现在你可以像这样使用正则式:

1 String pStr = "0x(?\\p{XDigit}{1,4})\\s++u\\+(?\\p{XDigit}{4})(?:\\s++)?";

2

3 Matcher m = Pattern.compile(pStr).matcher(INPUTTEXT);

4

5 if (m.matches()) {

6

7 int bs = Integer.valueOf(m.group("bytes"), 16);

8

9 int c = Integer.valueOf(m.group("char"), 16);

10

11 System.out.printf("[%x] -> [%04x]%n", bs, c);

12

13 }

14

15 String pStr = "0x(?\\p{XDigit}{1,4})\\s++u\\+(?\\p{XDigit}{4})(?:\\s++)?";

16

17 Matcher m = Pattern.compile(pStr).matcher(INPUTTEXT);

18

19 if (m.matches()) {

20

21 int bs = Integer.valueOf(m.group("bytes"), 16);

22

23 int c = Integer.valueOf(m.group("char"), 16);

24

25 System.out.printf("[%x] -> [%04x]%n", bs, c);

26

27 }

或者

1 System.out.println("0x1234 u+5678".replaceFirst(pStr, "u+$ 0x$"));

    

  评论这张
 
阅读(908)| 评论(0)

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018