小赖皮111 发表于 2013-11-14 15:35:12

抓取论坛列表的一个疑问

论坛列表页时,往往会出现一个主题后面带上相关页面,如<aonclick="atarget(this)" class="s xst">酷毙了 一分钟做一件合身的衣服</a>,是真实要抓的地址,然后后来还会带上<a >2</a><a >3</a><a >4</a><a >5</a><a >6</a>..
http://www.eeff.net/forum.php?mod=forumdisplay&fid=14&page=1 (参考网址),如何在设置时排斥呢。
再补充一个问题,那个论坛抓取的插件现在可以下载了吗 感觉抓取论坛内容页 也很麻烦,要设置很多排除条件。

303718 发表于 2013-11-14 15:41:00

列表用自定义连接采集呢

小赖皮111 发表于 2013-11-14 15:53:44

本帖最后由 小赖皮111 于 2013-11-14 15:59 编辑

303718 发表于 2013-11-14 15:41 static/image/common/back.gif
列表用自定义连接采集呢

http://xiangce.baidu.com/picture/album/list/e7cac10247dfe7d319a8fd0b604402c2023323db

这样子也不行


图片显示不出来,你直接打开这个图片网址 看看 http://xiangce.baidu.com/picture/album/list/e7cac10247dfe7d319a8fd0b604402c2023323db 看下我有写错吗

303718 发表于 2013-11-14 19:27:12

你的图是打不开的

小赖皮111 发表于 2013-11-15 08:29:47

303718 发表于 2013-11-14 19:27 static/image/common/back.gif
你的图是打不开的

权限不够,不能上传到相册,只能发到百度里的图片外链。
打开这个网址可以看到。
http://xiangce.baidu.com/picture/detail/d4392471dafec621dcbecb3e45dfe7d3b3122fed{:soso_e100:}
页: [1]
查看完整版本: 抓取论坛列表的一个疑问