抓取论坛列表的一个疑问
论坛列表页时,往往会出现一个主题后面带上相关页面,如<aonclick="atarget(this)" class="s xst">酷毙了 一分钟做一件合身的衣服</a>,是真实要抓的地址,然后后来还会带上<a >2</a><a >3</a><a >4</a><a >5</a><a >6</a>..http://www.eeff.net/forum.php?mod=forumdisplay&fid=14&page=1 (参考网址),如何在设置时排斥呢。
再补充一个问题,那个论坛抓取的插件现在可以下载了吗 感觉抓取论坛内容页 也很麻烦,要设置很多排除条件。 列表用自定义连接采集呢 本帖最后由 小赖皮111 于 2013-11-14 15:59 编辑
303718 发表于 2013-11-14 15:41 static/image/common/back.gif
列表用自定义连接采集呢
http://xiangce.baidu.com/picture/album/list/e7cac10247dfe7d319a8fd0b604402c2023323db
这样子也不行
图片显示不出来,你直接打开这个图片网址 看看 http://xiangce.baidu.com/picture/album/list/e7cac10247dfe7d319a8fd0b604402c2023323db 看下我有写错吗 你的图是打不开的 303718 发表于 2013-11-14 19:27 static/image/common/back.gif
你的图是打不开的
权限不够,不能上传到相册,只能发到百度里的图片外链。
打开这个网址可以看到。
http://xiangce.baidu.com/picture/detail/d4392471dafec621dcbecb3e45dfe7d3b3122fed{:soso_e100:}
页:
[1]