[XpathSiteRule.java](https://github.com/Zzzia/EasyBook/blob/master/easybookmodule/src/main/java/com/zia/easybookmodule/bean/rule/XpathSiteRule.java) 序列化书源json的类 [参考书源](https://github.com/Zzzia/EasyBook/blob/master/easybook.json) 假设网站是https://www.jx.la/ ,搜索斗破苍穹 ### 1. 填写siteName和baseUrl 在`siteName`中填入笔趣阁jx,将向用户展示这个名字 在`baseUrl`中填入 https://www.jx.la/ ,这个网址在后续爬取的url是相对链接时会按一定规律合并成完整链接。 ### 2. 解析搜索接口 1. 浏览器抓搜索接口 在搜索的时候抓一下请求了什么网址,chrome中直接使用开发者工具即可 我们搜索斗破苍穹,抓到搜索网址,以及他的请求参数:siteid=qula&q=斗破苍穹 https://sou.xanbhx.com/search?siteid=qula&q=%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9 在`searchUrl`中填入网址https://sou.xanbhx.com/search 2. 在`searchMethod`中填入GET/POST方法,这里我们是一个GET方法 3. 搜索接口的参数,填写`searchParam`:q=\{keyword\},\{keyword\}会被替换成搜索关键词 1. 如果是GET请求,会拼接成https://sou.xanbhx.com/q=斗破苍穹 这里GET请求还有其他参数,可以修改`searchParam`,例如将`searchParam`改为siteid=qula&q={keyword},会拼接成https://sou.xanbhx.com/search?siteid=qula&q=%E6%96%97%E7%A0%B4%E8%8B%8D%E7%A9%B9 2. 如果是POST请求,会post url地址,且以参数形式上传q=斗破苍穹 4. 请注意搜索的文本编码,可在`searchEncode`替换UTF-8/GBK 5. 搜索返回的结果文本编码可以修改`chapterEncodeType`替换UTF-8/GBK ### 3. 解析搜索结果 1. 找到搜索结果集合的Xpath ![搜索结果Xpath](http://zzzia.net:6676/upload/2019/12/image-20191229215342444-dfdc4f95c600458290b44c8ff3381a2d.png) 如图,每一个搜索结果都是一个\