zhuzhengxiang
发表于 2011-6-29 17:34:54
就没搞定我的,楼主大人
lee1986320
发表于 2011-6-30 13:03:51
回复 171# zhuzhengxiang
这个有什么规则,,,就是純静态的页面
webdigger
发表于 2011-6-30 18:35:43
169楼的问题挺普遍的,不知道火车头官方能否直接支持,就是数组形式的,一一对应。
zwxuan
发表于 2011-6-30 20:35:26
本帖最后由 zwxuan 于 2011-6-30 20:36 编辑
麻烦楼主看看这个网站,试了好几次都抓不出来。
http://house.qingdaonews.com/ershou/chushoulist.html
zhangxiang
发表于 2011-6-30 21:28:31
目标http://www.jiangsuedu.net/js/articles.jsp?cid=2271218
请帮忙指点!
zuanwan
发表于 2011-7-1 00:03:16
楼主太强 大了,
52piaoyu
发表于 2011-7-11 13:30:41
翻页编码都是这个样子的javascript:__doPostBack('SoftPotal$repeaterPager2$ctl03$LinkButton26','')
采集地址http://apk.gfan.com/Aspx/UserApp/softpotal.aspx?i=2&softCategory=3
鹤城人
发表于 2011-7-14 15:20:59
向楼主学习,http://www.cqvip.com/QK/91255X/201012/1001302760.html 这个网站的文章怎么采集,在此表示感谢,也可以付费请教。联系QQ:77634
hctsjw
发表于 2011-7-17 20:12:53
tom的新闻页,http://it.tom.com/list/159202_auto-6181_(*)/,采集出来的网址是http://it.tom.com/list/159202_auto-6181_1/563481/418306183749.shtml,但实际网址是
http://it.tom.com/563481/418306183749.shtml,求问怎么解决,谢谢
hctsjw
发表于 2011-7-17 20:13:35
tom的新闻列表页应该是这个:
http://it.tom.com/list/159202_auto-6181_1/