火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2533|回复: 2

请问一下,这个正则采集的标题怎么怎么写才对。

[复制链接]
发表于 2008-6-4 16:01:31 | 显示全部楼层 |阅读模式
我有个采集列表,有2个模板的,于是我用正则采集法,可是怎么设置都不对?

麻烦看下我哪里设置不对。

(<span class="lanse">[参数]</span>)|(<DIV id=newsbiaoti>[参数]</DIV>)  试过,无效!
(<span class="lanse">|<DIV id=newsbiaoti>)[参数](</span>|</DIV>) 无效.
可是分开的话,都有效,例如,
<span class="lanse">[参数]</span>
<DIV id=newsbiaoti>[参数]</DIV>
这2个分别都能采集到.
2个模板的源页面地址
http://dnf.17173.com/content/2008-05-29/20080529151849952.shtml
http://dnf.17173.com/content/2008-04-28/20080428100956244,1.shtml

还有问题,请看一下,http://dnf.17173.com/content/2008-04-28/20080428100956244,1.shtml
这个分页是用的JS代码分页,不知道该如何采集分页地址,.
发表于 2008-6-4 17:13:07 | 显示全部楼层
多个模块是不能用你上边的那种正则的,你先学习一下什么是正则表达式,可以在教程区里参考一下相关资料.
 楼主| 发表于 2008-6-4 21:12:05 | 显示全部楼层
晕倒,

        有没有简单一点可以实现的方法呢?

  难道,另写一个采集模块。?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-23 14:48

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表