大家帮忙看看这个网址怎么采集......
大家帮忙看看这个网址怎么采集......这个是需要采集的 网站列表页面http://www.to8to.com/yezhu/list-h2s4 这个网址结尾没有后缀 而是一个类似于文件夹的名称网站源码中 需要采集获取的文章地址又全是相对路径于是采集出来的网址全是相对于 list-h2s4 这个文件夹的 于是这个采集到的网址是有错误的.....举个例子:采集出来的网址是http://www.to8to.com/yezhu/list-2s4p2/z427.html但是实际的文章地址是 http://www.to8to.com/yezhu/z427.html是没有 list-h2s4这个文件夹的.......希望各位能帮忙一下.................. 可以使用手动采集网址,自己手动添加 手动连接:脚本规则 <li>·<a href="[参数]" target="_blank">
实际连接http://www.to8to.com/yezhu/[参数1] 脚本规则 <li>·<a href="[参数]" target="_blank">
实际连接http://www.to8to.com/yezhu/[参数1]
页:
[1]