发新话题
打印

[3.2版] 请问一下,这个正则采集的标题怎么怎么写才对。

请问一下,这个正则采集的标题怎么怎么写才对。

我有个采集列表,有2个模板的,于是我用正则采集法,可是怎么设置都不对?

麻烦看下我哪里设置不对。

(<span class="lanse">[参数]</span>)|(<DIV id=newsbiaoti>[参数]</DIV>)  试过,无效!
(<span class="lanse">|<DIV id=newsbiaoti>)[参数](</span>|</DIV>) 无效.
可是分开的话,都有效,例如,
<span class="lanse">[参数]</span>
<DIV id=newsbiaoti>[参数]</DIV>
这2个分别都能采集到.
2个模板的源页面地址
http://dnf.17173.com/content/2008-05-29/20080529151849952.shtml
http://dnf.17173.com/content/2008-04-28/20080428100956244,1.shtml

还有问题,请看一下,http://dnf.17173.com/content/2008-04-28/20080428100956244,1.shtml
这个分页是用的JS代码分页,不知道该如何采集分页地址,.

TOP

多个模块是不能用你上边的那种正则的,你先学习一下什么是正则表达式,可以在教程区里参考一下相关资料.

TOP

晕倒,

        有没有简单一点可以实现的方法呢?

  难道,另写一个采集模块。?

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.174223 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-9-5 14:39 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档