5180420 发表于 2012-11-23 20:32:57

求助采集网址

首页 www.xxxx.com
二级 www.xxxx.com/bool/7502
三级分页是www.xxxx.com/bool/7502/XXX.html
但是源码里面不是完整的链接,只有 XXX.html
请问那个完整地址应该怎么写?

303718 发表于 2012-11-23 20:39:48

这个用自动识别 ,网址应该会自动补全的呢

5180420 发表于 2012-11-23 21:52:38

303718 发表于 2012-11-23 20:39 static/image/common/back.gif
这个用自动识别 ,网址应该会自动补全的呢

在请教下,怎么屏蔽 分页的 index.html   

5180420 发表于 2012-11-23 21:54:24

本帖最后由 5180420 于 2012-11-23 21:55 编辑

<div class="book_listpage"><p class="list_page"><span>共27条记录 页次:1/3页</span><span class="disable">首页</span><span class="disable">上一页</span><span class="disable">1</span><a href="2.html">2</a><a href="3.html">3</a><a href="2.html">下一页</a><a href="3.html">尾页</a></p></div>
<div class="footer w890 center mt1 clear">">



它有个回到首页的链接

xiaojiela 发表于 2012-11-24 00:14:54

火车头自动会识别的.

463902 发表于 2012-11-24 04:47:01

你可以设置采集范围啊
页: [1]
查看完整版本: 求助采集网址