应bloom要求给大家发个太平洋规则改进版.
我采集的是太平洋游戏网的电玩新闻地址:
http://www.pcgames.com.cn/tvgames/bao/pic/index.html
选定采集区域:
<TABLE WIDTH="95%" BORDER="0" align="center" CELLPADDING="0" CELLSPACING="0">
到
<table width="93%" border="0" cellspacing="0" cellpadding="0">
获取标题:
<\s*h1\s*>
到
<\s*/h1\s*>
如果反应好(回复10)我就在二楼放过滤规则,可以过滤全部的杂质.
这个是以前发的过滤规则:
http://www.locoy.com/forum/viewthread.php?tid=2756&extra=page%3D1
[ 本帖最后由 GIMF 于 2006-2-18 17:48 编辑 ] 占位编辑
.::游戏前线::.
www.GIMF.org
[ 本帖最后由 GIMF 于 2006-2-18 17:49 编辑 ] 谢谢分享!!!!!!!!!!!!!!!!!!!!!! 想要的,正好要采那里的
请问下,回复能采进去吗? 规则
说实话偶还很菜
学习ING 获取标题:
<\s*h1\s*>
到
<\s*/h1\s*>
这个是 什么意思 呢 ,没看懂 ?
正则还不会,能不能解释下
1.2版的 标题都要用正则来采吗? 2.0的过滤很多过滤了 可以无限定制 只要把中间不想要的去掉 就可以了
页:
[1]