火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4771|回复: 1

火车头采集器如何编写指定范围正则表达式?

[复制链接]
发表于 2017-4-28 18:35:58 | 显示全部楼层 |阅读模式
使用火车头采集器采集文章内容页时,需要提取文章中的关键词。
文章代码格式如下:


<div class="xxx">
    <div class="content">
        这是一段文章内容,这是一段文章内容,这是一段文章内容
        <a href="http://xxx.com/xxx.html" target="_blank">关键词一</a>
        这是一段文章内容,这是一段文章内容,这是一段文章内容
        <a href="http://xxx.com/xxx.html" target="_blank">关键词二</a>
        这是一段文章内容,这是一段文章内容,这是一段文章内容
    </div>
</div>


我需要提取<div class="content"></div>中<a>标签内的关键词,关键词数量不限,需要循环匹配。
坐等大神解答,感谢!
发表于 2017-5-2 08:35:18 | 显示全部楼层
范围不是清楚了吗  做下多页设置
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-7 15:23

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表