找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 9169|回复: 5

火车头组合标签的问题

[复制链接]
发表于 2013-8-18 04:35:21 | 显示全部楼层 |阅读模式
发现一个很严重的BUG吧,不知道是不是官方故意留成这样的。

http://bbs.locoy.com/spider-96646-1-1.html 这篇帖子里的哥们可能没说清楚,我想我俩遇到的应该是一个问题。

那就是组合标签之后,数据变没有自理过的了

情况是这样的,我采了一个网站描述,然后采了内容,及内容里的图片。

描述为A标签,内容为B标签,B标签对图片进行下载

组合成C标签。

本来应该C标签显示的是描述加内容的,及内容中正常应该是采回来的本地图片的,结果正好相反,组合之后的C标签是A跟B未经处理过的原源码,这不是很操蛋么,难道要将AB里的数据自理再在组合标签里配置一次,应该不用吧?

So这可能是一个BUG? 太晚了,截图我就不截了,大家可以测试下,如果没不到的话,可以找我要截图的。
 楼主| 发表于 2013-8-28 11:59:52 | 显示全部楼层
没人?没人?没人?没人?
发表于 2013-8-28 13:57:24 | 显示全部楼层
关于标签组合功能的使用说明
作者:小文 发布于:2012-7-18 9:41 Wednesday 分类:功能介绍

v7版本增加了一个标签组合的功能,许多朋友在使用中发现组合的结果和自己想要的结果不一致,下面我来说明一下该功能的使用。

1.标签组合组合的是文件下载前的内容

有的朋友发现,a标签中下载了某个文件,原始地址是aaa,下载后或是探测的地址为bbb,那么,如果您在b标签中组合使用a标签,a标签的值是aaa.为何使用这种处理方法,是因为文件下载是在标签组合之后进行的。如何达到标签内容是文件下载完后的结果呢?可以新建一个标签,选“自定义固定格式数据”,将您标签组合的内容放进去。这里的替换会在文件下载后执行。

2.内容页标签循环采集并添加为新记录

如果组合的两个标签都是内容页标签,这两个标签在组合时,会按循环数最大的记录产生新的同样数目的循环记录。如果某个标签的循环数较少,则新产生的标签中该标签的值为空。例如标签a,b组合生成标签c。a的循环数是5,b的循环数是3,则会生成5个c,其中,前3个标签的值分别是a,b一一对应的。最后两个值中,b的值为空。假设a的值是11,22,33,44,55,b的值为aa,bb,cc.c是由[标签:a][标签:b]组合, 则产生的c的值为11aa,22bb,33cc,44,55.

3.列表页标签和内容页标签组合

如果两个标签中一个是内容页,一个是列表页,则内容页是会参加第2条中的循环处理,在这个过程中列表页当作一个字符串处理。合并完成后,程序会再进行数据处理操作。最后,组合标签中的列表页标签内容将被替换成实际的值。组合后的结果中,可以再提取下载。比如内容页a和列表页b组合生成c,其中a的值为11,22,22,b的值为bb,那么,c第一次组合结果是 11[标签:b],22[标签:b],33[标签:b],然后进行数据处理。如果b的值是bb,那么最后的结果就可能是11bb,22bb,33bb.



有的朋友可能会说,干嘛将这个功能搞这么复杂的。其实,这个功能主要是为第一条的功能使用的,其它的组合方式可能会产生和原想法不一样的结果。建议大家不要滥用这个功能,不要将它想像成万能的。

 楼主| 发表于 2013-9-7 18:21:37 | 显示全部楼层
303718 发表于 2013-8-28 13:57
关于标签组合功能的使用说明
作者:小文 发布于:2012-7-18 9:41 Wednesday 分类:功能介绍

在哪看到的,我找半天没找着?
发表于 2014-3-23 16:41:15 | 显示全部楼层
303718 发表于 2013-8-28 13:57
关于标签组合功能的使用说明
作者:小文 发布于:2012-7-18 9:41 Wednesday 分类:功能介绍

选“自定义固定格式数据”,将您标签组合的内容放进去!
请教,这一步具体如何操作呢?
发表于 2015-10-10 14:46:21 | 显示全部楼层
还要有个折中的方法,我还以为不能用了。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表