火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2043|回复: 2

我要采集<h1>和 简介 或者 剧情 之间的文本,怎么办呢?正则?

[复制链接]
发表于 2013-7-6 02:40:23 | 显示全部楼层 |阅读模式
我想采集电影的信息,一般都是
<h1>标题</h1>
..
..
..
<p>简介</p>   

简介 这一行可能会出现其他情况
<p>剧情</p>
<p>剧情简介</p>

我用“前后截取”的形式没办法匹配多个情况了,请问有什么方法可以截取呢?正则表达式?
发表于 2013-7-6 08:34:51 | 显示全部楼层
你可以分多个标签来采集
 楼主| 发表于 2013-7-6 08:46:06 | 显示全部楼层
本帖最后由 doufuguolyl 于 2013-7-6 08:56 编辑
303718 发表于 2013-7-6 08:34
你可以分多个标签来采集


你的意思是
<h1>.....简介
<h1>.....剧情
<h1>.....剧情简介
这三种情况,都采集发布到同一个标签里面去?

可能我理解有问题,这方法不行,三种情况同时出现,就会都采集到内容
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 15:45

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表