请问一下,这个正则采集的标题怎么怎么写才对。
我有个采集列表,有2个模板的,于是我用正则采集法,可是怎么设置都不对?麻烦看下我哪里设置不对。
(<span class="lanse">[参数]</span>)|(<DIV id=newsbiaoti>[参数]</DIV>)试过,无效!
(<span class="lanse">|<DIV id=newsbiaoti>)[参数](</span>|</DIV>) 无效.
可是分开的话,都有效,例如,
<span class="lanse">[参数]</span>
<DIV id=newsbiaoti>[参数]</DIV>
这2个分别都能采集到.
2个模板的源页面地址
http://dnf.17173.com/content/2008-05-29/20080529151849952.shtml
http://dnf.17173.com/content/2008-04-28/20080428100956244,1.shtml
还有问题,请看一下,http://dnf.17173.com/content/2008-04-28/20080428100956244,1.shtml
这个分页是用的JS代码分页,不知道该如何采集分页地址,. 多个模块是不能用你上边的那种正则的,你先学习一下什么是正则表达式,可以在教程区里参考一下相关资料. 晕倒,
有没有简单一点可以实现的方法呢?
难道,另写一个采集模块。?
页:
[1]