HtmlParser--TextExtractingVisitor
发布日期:2021-10-17 16:08:13 浏览次数:1 分类:技术文章

本文共 509 字,大约阅读时间需要 1 分钟。

import org.htmlparser.Parser;

import org.htmlparser.util.ParserException;

import org.htmlparser.visitors.HtmlPage;

import org.htmlparser.visitors.TextExtractingVisitor;

 

public class HTMLTest

{

    public static void main(String[] args) throws ParserException

    {

       Parser parser=new Parser("");

      

       parser.setEncoding("gb2312");

      

       TextExtractingVisitor visitor=new TextExtractingVisitor();

      

       parser.visitAllNodesWith(visitor);

      

       String s=visitor.getExtractedText();

      

//     String ss=s.replaceAll("", "");

       System.out.println(s);

      

 

    }

 

}

转载地址:https://blog.csdn.net/thamsyangsw/article/details/4423304 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:HtmlParser--HtmlPage
下一篇:HtmlParser--TagFindingVisitor源文件

发表评论

最新留言

关注你微信了!
[***.104.42.241]2024年04月05日 08时19分54秒