xiongyujie37 发表于 2008-9-3 07:57:08

我们来探讨探讨一个相对比较复杂的问题 看看能不能实现 关于多内容合并

举个例子:

某页面a.html包括10个目标采集对象分别为1.html、2.html……10.html

加入这10个页面内容都是关于当天推荐的彩票号码,分别为张三推荐号码、李四推荐号码,王五推荐号码。。。。。。,每篇采集内容不到50个字符

我们能够想什么办法,把采集到的这10个页面内容合并1个页面

变换标题

比如 2008-9-3精选号码推荐汇总

然后就是张三 李四王五 的 标题和内容了。。。。


目前,我是没有想到。。。。。。弱弱地请教大家可行不?

soarb 发表于 2008-9-3 08:56:48

两种方法,一种写程序,在前期合必10页的数据.然后再采集那个采集的页面,循环匹配.
 另一种大同小异.在接口中判断id是否能被10整除.如果真则将取此id前10id的数据,合必到此id,必清除前10id的数据.即可

xiongyujie37 发表于 2008-9-3 09:10:14

看来你的两种方法我都没办法用了。。。我不会写接口文件了。。。。

xiongyujie37 发表于 2008-9-3 19:06:04

米银来探讨这个问题来?

chenfy 发表于 2008-9-3 19:14:01

有点深澳,不懂,努力学习

mier001 发表于 2008-9-3 19:45:41

可以关于某个数据库字段来判断吧,最近也在研究这个,但是手上没有数据库编辑,有条件的可以试试,也可以联系我,给我个人版本研究研究

xyz5200 发表于 2008-9-3 20:34:36

采集能采成这样也不错了。

chenfy 发表于 2008-9-3 22:15:09

刚刚想了一下,以为能用多页采集合并的,但试过了没有用,多页的只能测试一个网址,不能多个,如果多页的能多个网址的话就没有问题了。
页: [1]
查看完整版本: 我们来探讨探讨一个相对比较复杂的问题 看看能不能实现 关于多内容合并