ilive 发表于 2006-11-1 02:27:17

一个关于URL采集的问题

pw论坛

http://······/read.php?tid=87327&fpage=2 (回复不足一页时火车采集到的地址)

http://······/read.php?tid=87327&page=1&fpage=2(回复超过一页时火车采集到的地址)

我不知道为什么帖子回复超过一页火车采集到的就是地址二,不是一(地址一和二都可以到这篇帖子)。

回复的帖子的地址是
http://······/read.php?tid=87327&page=1&fpage=2
http://······/read.php?tid=87327&page=2&fpage=2
http://······/read.php?tid=87327&page=3&fpage=2

问下大家这个地址抓取的怎么写

注意:fpage=2为此帖子所在板块的第2页   page=1为帖子第一页

火车3在必须包含里面不支持”|“ 如果支持可以写成必须包含:read|page=1 不得包含:不填

问题是在必须包含里面不支持啊········

这个怎么写啊 ``````````

insun 发表于 2006-11-1 18:10:44

我记得dz用tid=xxx就可以了,后面的那些东西可以省略,所以采集的时候用这个就可以,估计pw应该一样

cc5566 发表于 2006-11-2 10:14:38

直接抓TID?后面的不用加么?

管理员能给个图示的详解补?

guonning 发表于 2006-11-5 21:14:57

2楼是对的:lol

梦想中文 发表于 2006-11-17 11:17:11

后面不用加的,用2楼的办法就可以搞定
页: [1]
查看完整版本: 一个关于URL采集的问题