一个关于URL采集的问题
pw论坛http://······/read.php?tid=87327&fpage=2 (回复不足一页时火车采集到的地址)
http://······/read.php?tid=87327&page=1&fpage=2(回复超过一页时火车采集到的地址)
我不知道为什么帖子回复超过一页火车采集到的就是地址二,不是一(地址一和二都可以到这篇帖子)。
回复的帖子的地址是
http://······/read.php?tid=87327&page=1&fpage=2
http://······/read.php?tid=87327&page=2&fpage=2
http://······/read.php?tid=87327&page=3&fpage=2
问下大家这个地址抓取的怎么写
注意:fpage=2为此帖子所在板块的第2页 page=1为帖子第一页
火车3在必须包含里面不支持”|“ 如果支持可以写成必须包含:read|page=1 不得包含:不填
问题是在必须包含里面不支持啊········
这个怎么写啊 `````````` 我记得dz用tid=xxx就可以了,后面的那些东西可以省略,所以采集的时候用这个就可以,估计pw应该一样 直接抓TID?后面的不用加么?
管理员能给个图示的详解补? 2楼是对的:lol 后面不用加的,用2楼的办法就可以搞定
页:
[1]