xiejiaxue 发表于 2012-7-31 16:33:03

大家帮忙看看这个网址怎么采集......

大家帮忙看看这个网址怎么采集......

这个是需要采集的 网站列表页面http://www.to8to.com/yezhu/list-h2s4    这个网址结尾没有后缀 而是一个类似于文件夹的名称网站源码中 需要采集获取的文章地址又全是相对路径于是采集出来的网址全是相对于 list-h2s4   这个文件夹的 于是这个采集到的网址是有错误的.....举个例子:采集出来的网址是http://www.to8to.com/yezhu/list-2s4p2/z427.html但是实际的文章地址是 http://www.to8to.com/yezhu/z427.html是没有 list-h2s4这个文件夹的.......希望各位能帮忙一下..................

1033736011 发表于 2012-7-31 16:52:59

可以使用手动采集网址,自己手动添加

yuanzi1225 发表于 2012-7-31 17:31:45

手动连接:脚本规则 <li>·<a href="[参数]" target="_blank">
               实际连接http://www.to8to.com/yezhu/[参数1]

bjyuda 发表于 2012-7-31 22:48:18

脚本规则 <li>·<a href="[参数]" target="_blank">
               实际连接http://www.to8to.com/yezhu/[参数1]
页: [1]
查看完整版本: 大家帮忙看看这个网址怎么采集......