火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4213|回复: 6

求助这个规则怎么写?

[复制链接]
发表于 2008-9-24 17:57:26 | 显示全部楼层 |阅读模式
<div id='articleshow'><h3>七彩重庆</h3><div class='articlepath'><a href='/boards.php'>论坛区</a> : <a href='/posts/travel st.html'>旅行版</a></div><div id='articleinfo'>发表于: 2008年06月12日 11点27分      点击: 388</div>主题贴内容</div><div class="rightpad">这儿是N多垃圾代码....
<div class="user_comments_content">回复贴内容循环1</div>
<div class="user_comments_content">回复贴内容循环2</div>
<div class="user_comments_content">回复贴内容循环3</div>
<div class="user_comments_content">回复贴内容循环4</div>
<div class="user_comments_content">…………………………</div>

要采的是标红的地方。

谢谢

[ 本帖最后由 luring 于 2008-9-24 22:46 编辑 ]
发表于 2008-9-24 18:37:18 | 显示全部楼层
<div id='articleshow'><h3>(*)</h3><div class='articlepath'><a href='/boards.php'>论坛区</a> : <a href='/posts/travel st.html'>旅行版</a></div><div id='articleinfo'>发表于: 2008年(*)      点击: 388</div>[参数]</div><div class="rightpad">
<div class="user_comments_content">[参数]</div>



[参数1][参数2]
 楼主| 发表于 2008-9-24 21:00:12 | 显示全部楼层

回复 2楼 的帖子

谢谢。不过采不到哦。
是我没讲清楚...
一楼已经更新.3Q

[ 本帖最后由 luring 于 2008-9-24 22:02 编辑 ]
发表于 2008-9-24 22:09:46 | 显示全部楼层
主题:  点击: (*)</div>  到  </div>
内容:  <div class="user_comments_content">  到   </div>
注意,在内容标签里选上循环匹配标签
 楼主| 发表于 2008-9-24 22:14:18 | 显示全部楼层

回复 4楼 的帖子

主题和内容应该是在一起采出来吧?
这样分开来采,就入不了库了......
 楼主| 发表于 2008-9-24 22:14:56 | 显示全部楼层

回复 4楼 的帖子

晕,该楼是DZ的BUG所致
 楼主| 发表于 2008-9-24 22:45:33 | 显示全部楼层
解决。可能这表达式比较烂

<div id='articleinfo'>发表于: [0-9\u4E00-\u9600]+ [0-9\u4E00-\u9600]+&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;点击: [0-9]+</div>
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-23 06:55

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表