新手求天涯论坛的抓取规则,如下地址应该怎么采集?
如下地址应该怎么设计采集规则,我想采集前5页,但是地址除了12345变化外,还有后面一个地方在变化。。http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=3&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+13%3A15%3A16&strsubitem=&strsubitem2=
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=4&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+13%3A10%3A22&strsubitem=&strsubitem2=
http://www.tianya.cn/new/publicforum/articleslist.asp?pageno=5&stritem=funinfo&part=0&nextarticle=2010%2D11%2D19+12%3A55%3A00&strsubitem=&strsubitem2= 他的地址是根据时间来变化 需要通过接口处理 回复 2# 专业收费采集
能否具体点? 回复 2# 专业收费采集
怎么解决? 楼主看看教程。写写插件。很容易的。 回复 1# wanmei1608
看了你的描述,也使用其他方法测试了下这个网站的采集,普通的规则设置实现不了这个分页的采集,一个网址里含有两个变化的参数,这样的需要专门写个程序来处理下这个网址,就是常说的使用插件采集。 其实这个很简单,没你们想像的好么复杂 回复 7# zjyk1984
怎么解决? 回复 5# luckluck2010
怎么解决?
页:
[1]