找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2050|回复: 7

求助。。。采集规则求助,大神来帮忙看看?

[复制链接]
发表于 2012-5-17 14:48:17 | 显示全部楼层 |阅读模式
本帖最后由 zz789 于 2012-5-18 10:18 编辑

<td valign=top>第1张</td></tr></table></li><li>
.......
<a href='4586_9.html' ...........
<td valign=top>第9张</td></tr></table></li><li>
<a href='4586_10.html' target='_blank'><img src='../up/allimg/512/041Q2120249/12041Q20249-9-lp.jpg' border='0' width='200' heigth='100'></a><table align=center width=85% border=0 cellspacing=0 cellpadding=0><tr>
<td valign=top>第10张</td></tr></table></li></ul></div></div></div></div></td></tr>
想获取数字 10 这里应该怎么写呢?我新手菜鸟不会写啊。
大神们别光看啊 帮忙解决探讨下。。
发表于 2012-5-18 09:11:11 | 显示全部楼层
只获取数字10,还是1,2,3...都要呢?
发表于 2012-5-18 09:14:43 | 显示全部楼层
只获取10的话,开始字符串:第9张</td></tr></table></li><li>
<td valign=top>第 ,结束字符串:张
1,2,3...都要的话,就是开始字符串:<td valign=top>第,结束字符串:张</td>
然后勾选循环匹配
 楼主| 发表于 2012-5-18 10:13:28 | 显示全部楼层
zml123 发表于 2012-5-18 09:14
只获取10的话,开始字符串:第9张
第 ,结束字符串:张
1,2,3...都要的话,就是开始字符串:第,结束字 ...

谢谢啊。不过我表达错了。下面的9张,10张不是固定的。也有可能是8,9.

第9张</td></tr></table></li><li>
<a href='4586_10.html' target='_blank'><img src='../up/allimg/512/041Q2120249/12041Q20249-9-lp.jpg' border='0' width='200' heigth='100'></a><table align=center width=85% border=0 cellspacing=0 cellpadding=0><tr><td valign=top>第10张</td></tr></table></li></ul></div></div></div></div></td></tr>
发表于 2012-5-18 16:46:32 | 显示全部楼层
这个应该得用插件处理了
发表于 2012-5-18 20:31:52 | 显示全部楼层
看楼主的意思,如果能有个倒序截取的功能就可以了。拿 “张</td></tr></table></li></ul></div></div></div></div></td></tr>”做起始字符串,“<td valign=top>第”做结束字符串。

不过上面纯设想。貌似火车头还不支持吧。
发表于 2012-5-18 22:18:31 | 显示全部楼层
楼主可否给出该实例的所在网址,我用于检验下自己的思路.
发表于 2012-5-18 23:26:31 | 显示全部楼层
没有测试网址,博文只写了一小半。
http://blog.csdn.net/datacollection/article/details/7581753
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表