火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3474|回复: 4

分页可以支持正则吗?

[复制链接]
发表于 2008-12-3 18:03:07 | 显示全部楼层 |阅读模式
有的网站采用多模板

分页规则不是全站通用的,怎么搞呢?

好像大部分都是图片频道与文章频道的分页规则都是不一样的

如果细分了图片和文章频道倒还可以,可以通过分别建立2个任务来解决

恶心的是,部分站文章频道里面也嵌入大量的图片频道的内容

现在通过正则是可以获取内容和标题的

遗憾的是  分页规则不支持正则
发表于 2008-12-3 19:04:04 | 显示全部楼层
分页是可以采用正则的。不同模板匹配
 楼主| 发表于 2008-12-3 23:01:50 | 显示全部楼层
分页好像不支持 像

(<div class="description">|<div id="newsdetail-content-text">)(?<content>[\w\W]*?)(<div class="edit_rec">|<div id="pagelist">|<!--pagelist end-->|<div id="newsdetail_content_laiyuan">|<div class="f picbot">)


这样的正则哦
发表于 2010-12-15 08:35:24 | 显示全部楼层
回复 1# xiongyujie37
发表于 2016-2-8 20:12:30 | 显示全部楼层
和你们一块学习。。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 21:45

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表