【Java开源 HTML解析】

 

 HTML Parser   点击次数:757

HTML Parser实现即时HTML语法分析程序。

 NekoHTML   点击次数:335

NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。这个解析器能投扫描HTML文件并“修正”许多作者(人或机器)在编写HTML文档过程中常犯的错误。NekoHTML能增补缺失的父元素、自动用结束标签关闭相应的元素,以及不匹配的内嵌元素标签。NekoHTML的开发使用了Xerces Native Interface (XNI),后者是Xerces2的实现基础。

 JTidy   点击次数:280

JTidy 是 HTML Tidy用Java实现的移植版本,提供了一个HTML的语法检查器和很好的打印功能。类似它的非Java产品,JTidy可以用来清除格式不好和不对的 HTM。此外,JTidy提供了对整个HTML的DOM分析器。程序员可以将JTidy当作一个处理HTML文件的DOM解析器来使用。

 Java HTML Parser   点击次数:682

HTML Parser提供了一组Tag对象,这些对象可以深入解析一棵可搜索的结构树。


Google
 
Web www.ideagrace.com
  © IdeaGrace 2007