-
修改run.ini,添加下面两条,第一条默认是采集更新列表的,第二条是指定小说编号,现在的设置是从1到66542,可以根据自己的想法设置
-rule hk020.com.xml -ca
-rule hk020.com.xml -c 1-66542
-
修改start.sh(windows是start.bat)
默认的java -jar spider.jar -ca & 改成 java -jar spider.jar -m &
重启采集器就可以啦,这样就可以最快的从一个网站把数据都抓过来啦!
等把对方站的数据采集的差不多了,就可以把-rule hk020.com.xml -c 1-66542 去掉啦,用更新列表就可以啦!