alixqd 发表于 2007-1-3 19:10:30

帮我看看这个页面的不得包含项目怎么不起作用

地址 http://wt.wyun.com/forumdisplay.php?fid=62&filter=0&orderby=dateline&ascdesc=DESC

地址必须包含 viewthread.php?tid=   不得包含&page=

可是测试的时候怎么还有http://wt.wyun.com/viewthread.php?tid=221205&extra=page%3D1%26amp%3Bfilter%3D0%26amp%3Borderby%3Ddateline&page=3 这样的地址

这个不得包含相应怎么写啊,要不然采集起来太慢了,谢谢了

kyw 发表于 2007-1-3 20:23:19

我看看   这个站挺慢的   。。。。

kyw 发表于 2007-1-3 20:34:24

http://wt.wyun.com/archiver/?fid-62.html

看看这页。

alixqd 发表于 2007-1-3 20:49:45

http://wt.wyun.com/archiver/?fid-62.html 这个列表里面的页面都没有显示附件的,采集的是附件图片链接
现在的问题是,每个帖子都有三个网址浏览,比如说
http://wt.wyun.com/viewthread.php?tid=221181

http://wt.wyun.com/viewthread.php?tid=221181&extra=page%3D1%26amp%3Bfilter%3D0%26amp%3Borderby%3Ddateline

http://wt.wyun.com/viewthread.php?tid=221181&extra=page%3D1%26amp%3Bfilter%3D0%26amp%3Borderby%3Ddateline&page=1

采集器每个帖子采一遍,我设置的文章内容页面必须包含 viewthread.php?tid=(*)&extra=   不得包含 &page=还是每个帖子采集三次,上面那个文章列表地址必须包含和不得包含我都空着,到底应该怎么设置阿,谢谢了,困扰我好长时间了

netdream 发表于 2007-1-3 21:13:49

呵呵,尽情地采吧!
必须包含:viewthread
不得包含:extra
得到这样"http://wt.wyun.com/viewthread.php?tid=221181"的页面

alixqd 发表于 2007-1-4 01:14:02

i love you so much

史巴托的腹肌 发表于 2007-1-4 11:36:41

mm管理不适你随便爱的 :@

kyw 发表于 2007-1-4 18:47:46

原帖由 netdream 于 2007-1-3 21:13 发表
呵呵,尽情地采吧!
必须包含:viewthread
不得包含:extra
得到这样"http://wt.wyun.com/viewthread.php?tid=221181"的页面


真厉害!
页: [1]
查看完整版本: 帮我看看这个页面的不得包含项目怎么不起作用