发新话题
打印

测试了一下,几个采集器

测试了一下,几个采集器

火车头1.2
火车头2.0
火车头3.01

dede自带 3.1 lit
phpcms 自带火车头

小蜜蜂 1.11

SPR Collection

帝国4自带

===
目标页: http://www.cpgnuke.com/

===

结果:

火车头1.2     =退出
火车头2.0     -空白
火车头3.01   -空白

dede自带 3.1 lit     -可以采到列表,对相对路径解决不好。自己修改后正常
phpcms 自带火车头  -采不到列表,空白

小蜜蜂 1.11    -采集列表正常,采集文章正常,看不到中间过程,结果正常

SPR Collection   -采集列表正常,采集文章正常,导入数据库无法工作

帝国4自带  -采不到列表,空白

==
选择,小蜜蜂 1.11

TOP

谢谢你的提醒,我找到原因了
因为我的列表都是采集器自动匹配补全,但该站采用的是
<base href="http://www.cpgnuke.com/" /> 以后改进

全站统一的连接 所以无法分析出来
但是你可以使用火车头的特殊连接替换功能采集到你所需要的网址

TOP

火车,能说一下怎样写的吗?还是采不到。想用火车。

TOP

还有就是空白页的问题,测试单独页面是空白,什么都没有。

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.179121 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 06:28 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档