HtmlParser--TextExtractingVisitor
发布日期:2021-10-17 16:08:13
浏览次数:1
分类:技术文章
本文共 509 字,大约阅读时间需要 1 分钟。
import org.htmlparser.Parser;
import org.htmlparser.util.ParserException;
import org.htmlparser.visitors.HtmlPage;
import org.htmlparser.visitors.TextExtractingVisitor;
public class HTMLTest
{
public static void main(String[] args) throws ParserException
{
Parser parser=new Parser("");
parser.setEncoding("gb2312");
TextExtractingVisitor visitor=new TextExtractingVisitor();
parser.visitAllNodesWith(visitor);
String s=visitor.getExtractedText();
// String ss=s.replaceAll("", "");
System.out.println(s);
}
}
转载地址:https://blog.csdn.net/thamsyangsw/article/details/4423304 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
关注你微信了!
[***.104.42.241]2024年04月05日 08时19分54秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
6.3.1遍历二叉树
2019-04-27
6.4.1-6.4.2树、森林、二叉树的转换
2019-04-27
6.4.3树和森林的遍历
2019-04-27
6.6.1最优二叉树(赫夫曼树)
2019-04-27
6.6.2赫夫曼编码
2019-04-27
7.1图的定义和术语
2019-04-27
WEB安全基础-HTML相关知识
2019-04-27
Java基础入门笔记-对象与引用
2019-04-27
Java基础入门笔记-新建类
2019-04-27
WEB安全基础-WEB服务器相关知识
2019-04-27
Java基础入门笔记-重写
2019-04-27
Java基础入门笔记-多态
2019-04-27
WEB安全基础-PHP中GET与POST实践
2019-04-27
Java基础入门笔记-添加包
2019-04-27
Java基础入门笔记-Eclipse快捷操作
2019-04-27
WEB安全基础-PHP+MySQL实践
2019-04-27
Java基础入门笔记-静态方法
2019-04-27
Java基础入门笔记-字符串
2019-04-27
Java基础入门笔记-包装类
2019-04-27
Java基础入门笔记-随机数
2019-04-27