火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1717|回复: 1

头痛的问题请各位大虾帮忙看看

[复制链接]
发表于 2011-9-21 11:05:25 | 显示全部楼层 |阅读模式
采集的时候总是把副分类也采集上了,发布是总是多发一条[成功学]标题,使用必须包含.html但有些文章是.PHP的,请问要如何隔开例如必须包含.html,.php
  1.       <li><span>2011-09-02 09:54:12</span> <a class=ulink href='/html/lc/zhiliao/'>[成功学]</a><a class="f14px" href="/html/lc/zhiliao/20110902/37872.html" target="_blank">123成功</a> 人气:0
  2.       <div class="intro" ><a href="/html/lc/zhiliao/20110902/37872.html" target="_blank" alt="123成功学察"> </a>
复制代码
发表于 2011-9-21 16:55:55 | 显示全部楼层
使用手动填写链接地址模式采集,也就是正则循环匹配
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-27 07:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表