测试了一下,几个采集器
火车头1.2火车头2.0
火车头3.01
dede自带 3.1 lit
phpcms 自带火车头
小蜜蜂 1.11
SPR Collection
帝国4自带
===
目标页: http://www.cpgnuke.com/
===
结果:
火车头1.2 =退出
火车头2.0 -空白
火车头3.01 -空白
dede自带 3.1 lit -可以采到列表,对相对路径解决不好。自己修改后正常
phpcms 自带火车头-采不到列表,空白
小蜜蜂 1.11 -采集列表正常,采集文章正常,看不到中间过程,结果正常
SPR Collection -采集列表正常,采集文章正常,导入数据库无法工作
帝国4自带-采不到列表,空白
==
选择,小蜜蜂 1.11 谢谢你的提醒,我找到原因了
因为我的列表都是采集器自动匹配补全,但该站采用的是
<base href="http://www.cpgnuke.com/" /> 以后改进
全站统一的连接 所以无法分析出来
但是你可以使用火车头的特殊连接替换功能采集到你所需要的网址 火车,能说一下怎样写的吗?还是采不到。想用火车。 还有就是空白页的问题,测试单独页面是空白,什么都没有。
页:
[1]