如何在Crawljax中获取抓取内容 [英] How to Get Crawl content in Crawljax

查看：65 发布时间：2021/5/18 20:46:12 java web-crawler

本文介绍了如何在Crawljax中获取抓取内容的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我使用Crawljax抓取了动态网页.我可以获取当前的ID，状态和DOM.但我无法获得网站内容.任何人都可以帮助我吗?

I have crawl Dynamic webpage using Crawljax. i can able to get crawl current id, status and dom. but i can't get the Website content.. Any one help me??

CrawljaxConfigurationBuilder builder =
            CrawljaxConfiguration.builderFor("http://demo.crawljax.com/");
    builder.addPlugin(new OnNewStatePlugin() {



        @Override
        public String toString() {
            return "Our example plugin";
        }

                @Override
                public void onNewState(CrawlerContext cc, StateVertex sv) {

                    LOG.info("Found a new dom! Here it is:\n{}", cc.getBrowser().getStrippedDom());
                       String name = cc.getCurrentState().getName();
String url = cc.getBrowser().getCurrentUrl();
System.out.println(cc.getCurrentState().getDom());
System.out.println("New State: " + name + "; url: " + url);
                }
    });
    CrawljaxRunner crawljax = new CrawljaxRunner(builder.build());
    crawljax.call();

如何获取动态/java脚本网页内容.

How to get dynamic/java script Webpage content..

如何在Crawljax中获取抓取内容 [英] How to Get Crawl content in Crawljax

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录关闭

如何在Crawljax中获取抓取内容 [英] How to Get Crawl content in Crawljax

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录 关闭

登录关闭