1、停止采集器
检查采集器
ps axu | grep java
输入 kill 5756 注释:5756是采集器运行ID 每一次都会不同!
2、更换采集规则
采集器规则下载地址:http://www.yispider.com
用winscp软件上传新的采集规则--规则的目录是rules
然后编辑采集器目录中的collect.ini
将 rule_name=23zw.xml 注释:填写新的规则名称
3、启动采集器
先输入cd进入根目录,再 cd /usr/local/yispider 到采集器目录
再输入启动采集器的命令 java -jar spider.jar -ca &
1. 不带参数启动, 默认为采集规则中指定的所有小说, 即同-ca参数
2. 正常采集规则中指定的所有小说使用参数 -ca启动
3. 如果只采集部分小说, 可使用-c 111,222,333 或者-c 111-222启动采集器, 前者意思为采集目标站章节号为111,222,333的小说, 后者意思为采集目标站章节号从111到222之间的所有小说
4. 如果采集中出现了一些空章节, 或者小说封面、简介、进度、分类错误, 可以使用修复采集 -ra启动, 可指定修复内容
5. 如果只修复部分小说, 可使用-r 111,222,333 或者-c 111-222启动采集器, 参数含义类似-c, 只是-c为采集指定小说, -r为修复指定小说
6. 使用-r或-ra进行修复采集时可同时制定需要修复的选项, -cover,-intro,-top,-sub,-keywords,-degree,-etxt,-txt,以上参数分别对应封面图片, 小说简介, 小说大类,小说细类, 关键词, 写作进度, 空章节(只修复空章节), txt文本(无论本地是否存在对应的章节内容, 只要指定txt则重新采集)
7. 如果启动需要单独指定采集时使用的规则, 可使用-rule xxxx.xml参数(必须同时制定-ca -c -ra -r四个命令之一), 其中xxxx.xml为rules文件夹下的规则名, 注意这里的参数需要使用文件全名, 即带了后缀的, 如果不知道怎么看文件后缀, 请使用谷歌或者度娘
注意:退出采集器,一定要输入 exit 回车,不然容易造成采集器骤停!
4、建立默认封面
进入根目录,建一个cover文件夹
在这个文件夹里面放一张封面大小的jpg图片,同时将该图片命令为nocover.jpg
5、首页推荐
在区块里面可以修改各类小说的展示形式,可以自定义,也可以选择标准小说,然后按排行、推荐等方式展示,具体的视频已经做了演示。
6、语言包的更改
语言包如有变动,需要重启TOMCAT
重启的命令就是 service tomcat restart