易大师采集器使用技巧【图文教程】

来源：本站原创　浏览：1276次　时间：2017-08-10

1、停止采集器

检查采集器

ps axu | grep java

输入 kill 5756 注释：5756是采集器运行ID 每一次都会不同！

2、更换采集规则

采集器规则下载地址：http://www.yispider.com

用winscp软件上传新的采集规则--规则的目录是rules

然后编辑采集器目录中的collect.ini

将 rule_name=23zw.xml 注释：填写新的规则名称

3、启动采集器

先输入cd进入根目录，再 cd /usr/local/yispider 到采集器目录

再输入启动采集器的命令 java -jar spider.jar -ca &

1. 不带参数启动，默认为采集规则中指定的所有小说，即同-ca参数
2. 正常采集规则中指定的所有小说使用参数 -ca启动
3. 如果只采集部分小说，可使用-c 111,222,333 或者-c 111-222启动采集器，前者意思为采集目标站章节号为111,222,333的小说，后者意思为采集目标站章节号从111到222之间的所有小说
4. 如果采集中出现了一些空章节，或者小说封面、简介、进度、分类错误，可以使用修复采集 -ra启动，可指定修复内容
5. 如果只修复部分小说，可使用-r 111,222,333 或者-c 111-222启动采集器，参数含义类似-c，只是-c为采集指定小说， -r为修复指定小说
6. 使用-r或-ra进行修复采集时可同时制定需要修复的选项， -cover,-intro,-top,-sub,-keywords,-degree,-etxt,-txt，以上参数分别对应封面图片，小说简介，小说大类，小说细类，关键词，写作进度，空章节(只修复空章节)， txt文本(无论本地是否存在对应的章节内容，只要指定txt则重新采集)
7. 如果启动需要单独指定采集时使用的规则，可使用-rule xxxx.xml参数(必须同时制定-ca -c -ra -r四个命令之一)，其中xxxx.xml为rules文件夹下的规则名，注意这里的参数需要使用文件全名，即带了后缀的，如果不知道怎么看文件后缀，请使用谷歌或者度娘

注意：退出采集器，一定要输入 exit 回车，不然容易造成采集器骤停！

4、建立默认封面

进入根目录，建一个cover文件夹

在这个文件夹里面放一张封面大小的jpg图片，同时将该图片命令为nocover.jpg

5、首页推荐

在区块里面可以修改各类小说的展示形式，可以自定义，也可以选择标准小说，然后按排行、推荐等方式展示，具体的视频已经做了演示。

6、语言包的更改

语言包如有变动，需要重启TOMCAT

重启的命令就是 service tomcat restart