新人求助,这个分页采集该怎么写?(找了论坛里的很多分页)
在论坛里也搜了看了怎么试都不行,真是晕死了,新人寓钝,烦请热心的老大能说详细些。目标页:http://golf.hexun.com/2006-11-02/100659761.html
我的火车头内容采集规则设置如下:
[ 本帖最后由 朴凡 于 2008-8-26 21:08 编辑 ] 他这个是多模板的网站.要用正则才行.
(<div class="detail_cnt">|<div class="detailp">)(?<content>[\w\W]*?)<p align=center><font face=Tahoma>
分页<p align=center><font face=Tahoma>到</p> 谢谢sengl。
我还是不太明白,这个正则规则怎么设置呢?
(<div class="detail_cnt">|<div class="detailp">)(?<content>[\w\W]*?)<p align=center><font face=Tahoma>我应该填在哪里?
页:
[1]