火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: rq204

新手学习采集建议帖

[复制链接]
发表于 2009-11-23 21:52:45 | 显示全部楼层
无比赞同 无比赞同
发表于 2009-11-24 09:29:15 | 显示全部楼层
没有HTLM功底的行不行呀?
发表于 2009-11-26 22:29:10 | 显示全部楼层
不怕动手,但是也得多动脑。多找些套子一个个钻吧:)
发表于 2010-1-29 20:52:26 | 显示全部楼层
非常好非常好 值得参考
发表于 2010-2-21 01:53:51 | 显示全部楼层



发表于 2010-2-21 01:57:06 | 显示全部楼层
不错的

谢谢了
发表于 2010-2-23 17:56:30 | 显示全部楼层
自定义正则语法规则:
此项可以很精确的分析到要采集的数据,填写后,下面三项建议清空.
举例比如网页中的html代码如下
<tr><td><img src="图片地址"><a href="内容页URL地址" title="注释信息">信息标题</a></td></tr>
那么左边输入
<tr><td><img src="{picurl=NO"}"><a href="{url=NO"}" title="{NO"}">{title=NO<}</a></td></tr>
其中{url=NO"}的意义是地址等于不包含有"双引号的所有字符串
其中{title=NO<}的意义是标题等于不包含有<号的所有字符串
其中{NO"}的意义代表不包含有"号的所有字符串,为何他前面没有等号?那是因为不考虑取他的值,因为每个标题的title都不一样.所以这里要给他定义一个正则语法.其他固定的格式就不必处理了
注:NO后面可以写上任何字符,可多个,但不能为中文,
例如:{url=NO' "=<>}代表除' "=<>他们之外的所有字符串

这上面的怎么看都理解不懂到底是怎么个意思,你可以帮我们说说吗!!

我测试采集成功了的,但是真采集时提示没有选折标题采集会失败,标题怎么设置呢!!!
发表于 2010-2-24 04:44:45 | 显示全部楼层
终于可以说话了!!
发表于 2010-2-24 20:15:22 | 显示全部楼层
哎,火车头是要钱的吧,而且,哪里有手册呢
发表于 2010-3-15 00:00:40 | 显示全部楼层
学习啊。。。
谢谢大虾了啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-15 14:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表