12 12
发新话题
打印

感谢+报告作者:DVBBS采集导入成功!

感谢+报告作者:DVBBS采集导入成功!

  http://bailixia.com/bbs/index.asp?boardid=56

提个建议,

修改网址不方便,建议把已保存的网址设置成可见!

TOP

是可见的。。你选定你用的网址
选修改/查看

TOP

发现一问题。假如我要采BBS的一个版面的话。他的ID不是连续的,可以按工具只能生成连续ID来采。这个办法咱实现。

TOP

不多就自己一个一个添加。
要不到它的上级页面采集

TOP

上级页面要怎么搞?
比如采论坛。且没有生成HMTL的。

TOP

我建议。最好是根据采集读取的页面连接采集。假如采的页面为:
http://a.com/disp.asp?pid=1这是一个版面!
那么下面就是贴子表!比如第一条为:
http://a.com/read.asp?id=1
http://a.com/read.asp?id=500
http://a.com/read.asp?id=210
如果按生成页面的话。他是从1到500。而其实这个版1-500就3个贴子,
如果按http://a.com/disp.asp?pid=1来取连接的话,就方便多了。

TOP

http://a.com/disp.asp?pid=1
http://a.com/disp.asp?pid=3
http://a.com/disp.asp?pid=5

将版面全部加入在网址列表,再点获取二级连接,利用规则过滤

TOP

试试!

TOP

又一BUG报告!

保存本地图片时在文件名后面加上了_chinacnw.com

TOP

请火车老大有空试一下采集dvbbs,我采集地址总是不成功

TOP

 12 12
发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.193851 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-5 20:17 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档