如何采集论坛 下面这个论坛采集老是有问题
我在做一个游戏论坛网站. 采集文章的时候一点问题都没有.但在采集论坛的时候 连网址都采集不正确.把许多其它的无用的链接也采集进来了.
我也 做了不得包含............... 这些.可是不行. 要么采集不到网址.要不就什么都采集进来
我要采的网址:
http://bbs2.1t1t.com/forumdisplay.php?s=&forumid=244 3、关于DZ论坛采集的网址问题
http://bbs.locoy.com/spider-19959-1-1.html
答:这个问题是属于个人不够细心的原因。比如网址:http://www.xxxx.com/viewthread.php?tid=314941&sid=IhHk6o 在采集网址规则中你主要在”文章内容只要包括以下内容“处填入”viewthread.php?tid=(*)“ 再在不得包含中填“page="
另外一种就是静态的DZ,可以这样设置:“thread-(*)-1-1.html”
我已经找到了 page=|extra=加上了这些 . 多了一个.
但我还是不会采集 回复的贴子 我只给你找出23个贴~~不知道对错, 原帖由 lxfh985ii 于 2007-12-7 12:02 发表 http://bbs.locoy.com/images/common/back.gif
我只给你找出23个贴~~不知道对错,
http://bbs2.1t1t.com/forumdisplay.php?s=&forumid=244 显示总共 2618 中的 1 到 25 条记录
比我好多了 贴个图吧 我没细整,一个是51,一个23,正研究呢~~
页:
[1]