火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2859|回复: 7

我们来探讨探讨一个相对比较复杂的问题 看看能不能实现 关于多内容合并

[复制链接]
发表于 2008-9-3 07:57:08 | 显示全部楼层 |阅读模式
举个例子:

某页面a.html包括10个目标采集对象分别为1.html、2.html……10.html

加入这10个页面内容都是关于当天推荐的彩票号码,分别为张三推荐号码、李四推荐号码,王五推荐号码。。。。。。,每篇采集内容不到50个字符

我们能够想什么办法,把采集到的这10个页面内容合并1个页面

变换标题

比如 2008-9-3精选号码推荐汇总

然后就是张三 李四  王五 的 标题和内容了。。。。


目前,我是没有想到。。。。。。弱弱地请教大家可行不?
发表于 2008-9-3 08:56:48 | 显示全部楼层
两种方法,一种写程序,在前期合必10页的数据.然后再采集那个采集的页面,循环匹配.
 另一种大同小异.在接口中判断id是否能被10整除.如果真则将取此id前10id的数据,合必到此id,必清除前10id的数据.即可
 楼主| 发表于 2008-9-3 09:10:14 | 显示全部楼层
看来你的两种方法  我都没办法用了。。。我不会写接口文件了。。。。
 楼主| 发表于 2008-9-3 19:06:04 | 显示全部楼层
米银来探讨这个问题来?
发表于 2008-9-3 19:14:01 | 显示全部楼层
有点深澳,不懂,努力学习
发表于 2008-9-3 19:45:41 | 显示全部楼层
可以关于某个数据库字段来判断吧,最近也在研究这个,但是手上没有数据库编辑,有条件的可以试试,也可以联系我,给我个人版本研究研究
发表于 2008-9-3 20:34:36 | 显示全部楼层
采集能采成这样也不错了。
发表于 2008-9-3 22:15:09 | 显示全部楼层
刚刚想了一下,以为能用多页采集合并的,但试过了没有用,多页的只能测试一个网址,不能多个,如果多页的能多个网址的话就没有问题了。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-18 01:41

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表