大家帮忙看看这个网址怎么采集......

xiejiaxue 发表于 2012-7-31 16:33:03

大家帮忙看看这个网址怎么采集......

这个是需要采集的网站列表页面http://www.to8to.com/yezhu/list-h2s4 这个网址结尾没有后缀而是一个类似于文件夹的名称网站源码中需要采集获取的文章地址又全是相对路径于是采集出来的网址全是相对于 list-h2s4 这个文件夹的于是这个采集到的网址是有错误的.....举个例子：采集出来的网址是http://www.to8to.com/yezhu/list-2s4p2/z427.html但是实际的文章地址是 http://www.to8to.com/yezhu/z427.html是没有 list-h2s4这个文件夹的.......希望各位能帮忙一下..................

1033736011 发表于 2012-7-31 16:52:59

可以使用手动采集网址，自己手动添加

yuanzi1225 发表于 2012-7-31 17:31:45

手动连接：脚本规则 <li>·<a href="[参数]" target="_blank">
实际连接http://www.to8to.com/yezhu/[参数1]

bjyuda 发表于 2012-7-31 22:48:18

脚本规则 <li>·<a href="[参数]" target="_blank">
实际连接http://www.to8to.com/yezhu/[参数1]

页: [1]

火车采集器软件交流官方论坛's Archiver

大家帮忙看看这个网址怎么采集......