帮我看看这个页面的不得包含项目怎么不起作用
地址 http://wt.wyun.com/forumdisplay.php?fid=62&filter=0&orderby=dateline&ascdesc=DESC地址必须包含 viewthread.php?tid= 不得包含&page=
可是测试的时候怎么还有http://wt.wyun.com/viewthread.php?tid=221205&extra=page%3D1%26amp%3Bfilter%3D0%26amp%3Borderby%3Ddateline&page=3 这样的地址
这个不得包含相应怎么写啊,要不然采集起来太慢了,谢谢了 我看看 这个站挺慢的 。。。。 http://wt.wyun.com/archiver/?fid-62.html
看看这页。 http://wt.wyun.com/archiver/?fid-62.html 这个列表里面的页面都没有显示附件的,采集的是附件图片链接
现在的问题是,每个帖子都有三个网址浏览,比如说
http://wt.wyun.com/viewthread.php?tid=221181
http://wt.wyun.com/viewthread.php?tid=221181&extra=page%3D1%26amp%3Bfilter%3D0%26amp%3Borderby%3Ddateline
http://wt.wyun.com/viewthread.php?tid=221181&extra=page%3D1%26amp%3Bfilter%3D0%26amp%3Borderby%3Ddateline&page=1
采集器每个帖子采一遍,我设置的文章内容页面必须包含 viewthread.php?tid=(*)&extra= 不得包含 &page=还是每个帖子采集三次,上面那个文章列表地址必须包含和不得包含我都空着,到底应该怎么设置阿,谢谢了,困扰我好长时间了 呵呵,尽情地采吧!
必须包含:viewthread
不得包含:extra
得到这样"http://wt.wyun.com/viewthread.php?tid=221181"的页面 i love you so much mm管理不适你随便爱的 :@ 原帖由 netdream 于 2007-1-3 21:13 发表
呵呵,尽情地采吧!
必须包含:viewthread
不得包含:extra
得到这样"http://wt.wyun.com/viewthread.php?tid=221181"的页面
真厉害!
页:
[1]