火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4441|回复: 5

提取规则不太懂,请指教下

[复制链接]
发表于 2016-5-3 11:30:56 | 显示全部楼层 |阅读模式
本帖最后由 shaoly518 于 2016-5-3 11:36 编辑

我想采取一个论坛,下面的代码是一个列表页下的其中一个标题的链接
<td><a title="热门主题" href="read-htm-tid-657893-orderway-postdate-asc-DESC.html" target="_blank"><img src=
我写成
<td><a title=(*) href="read-htm-tid-[参数]-orderway-postdate-asc-DESC.html" target="_blank"><img src=


不知道这样写到底哪不对,测试时根本就采不到标题链接
请高手指教一下
发表于 2016-5-3 11:40:33 | 显示全部楼层
这样试试href="read-htm-tid-[参数]-
发表于 2016-5-3 14:15:03 | 显示全部楼层
提取规则只要有较强特征就行(不会少采,也不至于多采)
你这个提取规则可以是
<td><a title=(*) href="read-htm-tid-[参数]-orderway-postdate-asc-DESC.html"
然后还要拼接地址,就是获得这个链接的全址。我也不知道你这个链接的全址是什么,假设是
http://www.baidu.com/read-htm-ti ... tdate-asc-DESC.html,那你的拼接地址就写
http://www.baidu.com/read-htm-tid-[参数1]-orderway-postdate-asc-DESC.html
 楼主| 发表于 2016-5-3 17:02:27 | 显示全部楼层
没用啊,其它工具用同一条代码可以完整的匹配出来,火车头就不行,不知道什么原因
 楼主| 发表于 2016-5-3 19:55:51 | 显示全部楼层
js2016 发表于 2016-5-3 14:15
提取规则只要有较强特征就行(不会少采,也不至于多采)
你这个提取规则可以是
...

不是拼接的问题,,而是提取不到参数内的数值
发表于 2016-5-3 20:01:40 | 显示全部楼层
shaoly518 发表于 2016-5-3 19:55
不是拼接的问题,,而是提取不到参数内的数值

列表页的网址是什么,我试试
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 23:34

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表