Java正则表达式性能 [英] Java regex performance

查看：303 发布时间：2018/12/7 18:47:16 java regex performance profiling benchmarking

本文介绍了Java正则表达式性能的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在尝试用Java解析带有正则表达式的链接。

I'm trying to parse links with regex with Java.

但我觉得它太慢了。例如，要从中提取所有链接：

But I think it's getting too slow. For example, to extract all links from:

http://news.google.com.ar/nwshp?hl=es&tab=wn

http://news.google.com.ar/nwshp?hl=es&tab=wn

......花费34642毫秒（34秒!!!）

...it's spending 34642 milliseconds (34 seconds!!!)

这是正则表达式：

private final String regexp = "<a.*?\\shref\\s*=\\s*([\\\"\\']*)(.*?)([\\\"\\'\\s].*?>|>)";

模式的标志：

private static final int flags = Pattern.CASE_INSENSITIVE | Pattern.DOTALL |Pattern.MULTILINE | Pattern.UNICODE_CASE | Pattern.CANON_EQ;

代码可能是这样的：

private void processURL(URL url){
    URLConnection connection;
    Pattern pattern = Pattern.compile(regexp, flags);
    try {
        connection = url.openConnection();
        InputStream in = connection.getInputStream();
        BufferedReader bf = new BufferedReader(new InputStreamReader(in));
        String html = new String();
        String line = bf.readLine();            
        while(line!=null){
            html += line;
            line = bf.readLine();
        }
        bf.close();
        Matcher matcher = pattern.matcher(html);
        while (matcher.find()) {
            System.out.println(matcher.group(2));
        }
     } catch (Exception e){
     }
 }

你能给我一个提示吗？

额外数据：

1Mbit

Core 2 Duo

1Gb RAM

单线程

Extra Data:
1Mbit
Core 2 Duo
1Gb RAM
Single Threaded

Java正则表达式性能 [英] Java regex performance

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录关闭

Java正则表达式性能 [英] Java regex performance

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录 关闭

登录关闭