朴凡 发表于 2008-8-26 21:06:58

新人求助,这个分页采集该怎么写?(找了论坛里的很多分页)

在论坛里也搜了看了怎么试都不行,真是晕死了,新人寓钝,烦请热心的老大能说详细些。

目标页:http://golf.hexun.com/2006-11-02/100659761.html

我的火车头内容采集规则设置如下:

[ 本帖最后由 朴凡 于 2008-8-26 21:08 编辑 ]

sengl 发表于 2008-8-26 22:17:40

他这个是多模板的网站.要用正则才行.
(<div class="detail_cnt">|<div class="detailp">)(?<content>[\w\W]*?)<p align=center><font face=Tahoma>

分页<p align=center><font face=Tahoma>到</p>

朴凡 发表于 2008-8-27 10:43:48

谢谢sengl。
我还是不太明白,这个正则规则怎么设置呢?
(<div class="detail_cnt">|<div class="detailp">)(?<content>[\w\W]*?)<p align=center><font face=Tahoma>我应该填在哪里?
页: [1]
查看完整版本: 新人求助,这个分页采集该怎么写?(找了论坛里的很多分页)