发新话题
打印

分页因为路径问题,无法采集

分页因为路径问题,无法采集

TOP

我试了下,也采不到分页,奇怪了

TOP

是的,因为分页的路径有问题,比如 象
http://www.it.com.cn/f/dv/069/13/324383.htm,这样的网页,里面的分页居然是 :
复制内容到剪贴板
代码:
<a href="324383_1.htm">[下一页]</a>
按照一般的思路应该是 :
复制内容到剪贴板
代码:
<a href="/f/dv/069/13/324383_1.htm">[下一页]</a>
就是这个原因,火车不能分辨出它真正的路径了,所以采不到,现在这样分页的网站已经很多,都采集不了。

[ 本帖最后由 pink 于 2006-9-13 22:31 编辑 ]

TOP

是的,这个问题现在普遍存在,很多网站都是这样,怎么解决?

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.187574 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-23 19:53 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档