jsoup （jsoup select）

内容

使用Jsoup怎样解析本地的html文件

java读取html文件跟读取普通文件一样，都是使用输入输出流，但是java读取html文件之后还需要解析，使用Jsoup对html进行解析。下面是一个java读取带表格的任意html文件，并把html文件转换成excel的例子。

jsoup可以解析出 js 的文件名，至于 js 文件里的内容，可以用程序下载能得到的，但这不是 jsoup 干的事。

猜想你的16行是 Elements links=content.getElementsByTag(a)；这一句你的content没有被正确取出，所以content是空。

Jsoup Jsoup是一个集强大和便利于一体的HTML解析工具。它方便的地方是，可以用于支持用jQuery中css selector的方式选取元素，这对于熟悉js的开发者来说基本没有学习成本。

jsoup只是解析静态HTML文本，页面上通过脚本动态生成的HTML是不会在网页源文件中反映出来的。

解析器，不是 http 客户端，如果需要在复杂的网络环境请使用 httpclient 先获取到 html 内容，再交给 jsoup 去解析。希望回答对你有帮助，如果有疑问，请继续追问答题不易，互相理解，您的采纳是我前进的动力，感谢您。

jsoup （jsoup select）

1、File input = new File(/tmp/input.html)；Document doc = Jsoup.parse(input， UTF-8， IP)；看看这个代码，调用 doc.text() 方法即可。

2、jsoup是一款Java的HTML解析器，主要用来对HTML解析。官网中文文档在爬虫的时候，当我们用HttpClient之类的框架，获取到网页源码之后，需要从网页源码中取出我们想要的内容，就可以使用jsoup这类HTML解析器了。

3、Jsoup解析是按照字符串解析的，比如：Document doc=Jsoup.parse(response1Str)；这句传入的response1Str就是一个String类型。因此你只需把本地html文件作为文本全读入为一个字符串，然后再用JSoup进一步解析就行了。

1、Document doc = Jsoup.parse(html)；Element link = doc.select(div#aa)；//使用id 如果要获取div里面的其它节点直接doc.select(div#aap) id=p的节点。

2、Jsoup可以解析XML，不过要比较新的版本才支持，你解析XML文档时，调用这个parse方法，Document doc=Jsoup.parse(html，， Parser.xmlParser())；，后面就和解析html一样了，可以调用select选标签等等。

jsoup （jsoup select）

3、这段html实际上是不符合规范的。在用jsoup解析时会出现问题。我想到一个办法解决这个问题。首先我想你应该是想得到标题、馆藏复本的数目、可借复本的数目、朱印宏编著和长江出版社。

4、◇通过类似于css或jQuery的选择器来查找元素使用的是Element类的下记方法：public Elements select(String cssQuery)通过传入一个类似于CSS或jQuery的选择器字符串，来查找指定元素。

标签

jsoup