找回密码

火车采集器软件交流官方论坛

搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2187|回复: 1

求助!求助!有个采集规则希望大家给点思路!

[复制链接]
发表于 2017-6-10 22:15:45 | 显示全部楼层 |阅读模式
地址:jinyici.xpcha.com/ea4ef290ne0.html

我要采集近义词的内容和完整的注释。

但问题是有个别注释内容显示不全,有些注释有部分被隐藏了,比如“借字”的注释部分被隐藏,所以我想去后面链接的详细解释页面采集,替换原来的注释。

欠据借字借单的内容显示情况基本概括了所有情况了。
欠据是注释显示全的且尾部带链接的情况。(称为A情况)
借字是注释显示不全但尾部带链接的情况。(称为B情况)
借单是没有注释。尾部不带链接的情况。(称为C情况)

我自己采集的思路是:
AB情况可以合并看待,因为尾部带链接,我们可以去详细页面采集详细的注释,替换原来的注释。
C情况就不采集注释了,因为没有链接,没有地方采集。
我采集后要的内容排版和原页面差不多,只是去掉后面的链接,有注释的注释要采集来显示全,真的没有注释的就不要采集了。

思路是很清晰,但我在火车头上不知道怎么实现,我用多页采集,都实现不了我的思路。

不知道怎么解决,求大神给个方法吧。
发表于 2017-6-19 08:23:43 | 显示全部楼层
每种都采集。然后用插件判断那个字多就存哪个。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

温馨提示:建议您联系官方定制服务,通过官方支付方式完成支付。您与其他非官方账号发生的交易,我方概不承担责任。网络有风险,交易需谨慎

QQ| 手机版|Archiver| 火车采集器官方站

Copyright © 2001-2013 Comsenz Inc.  Template by Comeings! All Rights Reserved.

Powered by Discuz! X3.4( 皖ICP备06000549 )

快速回复 返回顶部 返回列表