发新话题
打印

应bloom要求给大家发个太平洋规则改进版.

应bloom要求给大家发个太平洋规则改进版.

我采集的是太平洋游戏网的电玩新闻
地址:
http://www.pcgames.com.cn/tvgames/bao/pic/index.html

选定采集区域:
<TABLE WIDTH="95%" BORDER="0" align="center" CELLPADDING="0" CELLSPACING="0">

<table width="93%" border="0" cellspacing="0" cellpadding="0">

获取标题:
<\s*h1\s*>

<\s*/h1\s*>

如果反应好(回复10)我就在二楼放过滤规则,可以过滤全部的杂质.
这个是以前发的过滤规则:
http://www.locoy.com/forum/viewthread.php?tid=2756&extra=page%3D1

[ 本帖最后由 GIMF 于 2006-2-18 17:48 编辑 ]
本帖最近评分记录
  • bloom +20 把过滤规则发上呀。 . 2006-2-18 18:02

TOP

占位编辑

.::游戏前线::.
www.GIMF.org

[ 本帖最后由 GIMF 于 2006-2-18 17:49 编辑 ]

TOP

谢谢分享!!!!!!!!!!!!!!!!!!!!!!

TOP

想要的,正好要采那里的

请问下,回复能采进去吗?

TOP

规则
说实话偶还很菜
学习ING

TOP

获取标题:
<\s*h1\s*>

<\s*/h1\s*>

这个是 什么意思 呢 ,没看懂 ?
正则还不会,能不能解释下

1.2版的 标题都要用正则来采吗?

TOP

2.0的过滤很多过滤了 可以无限定制 只要把中间不想要的去掉 就可以了

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.129294 second(s), 8 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-14 12:33 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档