GIMF 发表于 2006-2-18 17:44:36

应bloom要求给大家发个太平洋规则改进版.

我采集的是太平洋游戏网的电玩新闻
地址:
http://www.pcgames.com.cn/tvgames/bao/pic/index.html

选定采集区域:
<TABLE WIDTH="95%" BORDER="0" align="center" CELLPADDING="0" CELLSPACING="0">

<table width="93%" border="0" cellspacing="0" cellpadding="0">

获取标题:
<\s*h1\s*>

<\s*/h1\s*>

如果反应好(回复10)我就在二楼放过滤规则,可以过滤全部的杂质.
这个是以前发的过滤规则:
http://www.locoy.com/forum/viewthread.php?tid=2756&extra=page%3D1

[ 本帖最后由 GIMF 于 2006-2-18 17:48 编辑 ]

GIMF 发表于 2006-2-18 17:44:54

占位编辑

.::游戏前线::.
www.GIMF.org

[ 本帖最后由 GIMF 于 2006-2-18 17:49 编辑 ]

netdream 发表于 2006-2-18 18:37:40

谢谢分享!!!!!!!!!!!!!!!!!!!!!!

光辉 发表于 2006-2-21 16:24:30

想要的,正好要采那里的

请问下,回复能采进去吗?

donlinn 发表于 2006-2-21 19:31:04

规则
说实话偶还很菜
学习ING

atboy 发表于 2006-2-21 19:55:23

获取标题:
<\s*h1\s*>

<\s*/h1\s*>

这个是 什么意思 呢 ,没看懂 ?
正则还不会,能不能解释下

1.2版的 标题都要用正则来采吗?

omn 发表于 2006-2-22 01:03:38

2.0的过滤很多过滤了 可以无限定制 只要把中间不想要的去掉 就可以了
页: [1]
查看完整版本: 应bloom要求给大家发个太平洋规则改进版.