发新话题
打印

[3.2版] 为什么分页采集那么难..用168能采的为什么火车不行..

为什么分页采集那么难..用168能采的为什么火车不行..

http://www.52pk.com/shtml/20080718/338017.shtml

<div class="w689 fy lt">上一页 1 <a href='http://www.52pk.com/shtml/20080718/338017_2.shtml' target='_self'>[2]</a> <a href='http://www.52pk.com/shtml/20080718/338017_3.shtml' target='_self'>[3]</a> <a href='http://www.52pk.com/shtml/20080718/338017_2.shtml' target='_self'>下一页</a> </div>

分页源码..
怎么选怎么不出来...
用php168自带的就能行...

是不是分页还有待加强啊...

分页做的和那个列表页一样不好采点吗.......


这个分页中有

<div class="w689 lt"><a name="pb"></a><div class="w660 pb lt"id="tt2"><h3><span><select id='dedepagetitles' onchange='location.href=this.options[this.selectedIndex].value;'>
<option value='http://www.52pk.com/shtml/20080718/338017.shtml'>1、第一页</option>
<option value='http://www.52pk.com/shtml/20080718/338017_2.shtml'>2、第二页</option>
</select>
</span>第一页</h3></div></div>

是个向下选择的分页..也不行......

高手们帮帮试试啊......

TOP

这个是你的设置有误,这个页面可以使用自动识别,不过他里边多了一个网址,最后会采到一些垃圾信息。你也可以使用自定义网址,具体区域就是上边你选的,格式那块网址的获得和网址采集那块一样的
附件: 您所在的用户组无法下载或查看附件

TOP

收下了...琢磨下!

TOP

回复 2楼 的帖子

用你发的那个也试了,我这边不行..
链接样式
[参数]_(*).shtml
分页网址..
http://www.52pk.com/shtml/[参数1]/[参数2]_[参数N].shtm


难不成是火车版本问题?

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.206516 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 01:14 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档