我们来探讨探讨一个相对比较复杂的问题 看看能不能实现 关于多内容合并
举个例子:某页面a.html包括10个目标采集对象分别为1.html、2.html……10.html
加入这10个页面内容都是关于当天推荐的彩票号码,分别为张三推荐号码、李四推荐号码,王五推荐号码。。。。。。,每篇采集内容不到50个字符
我们能够想什么办法,把采集到的这10个页面内容合并1个页面
变换标题
比如 2008-9-3精选号码推荐汇总
然后就是张三 李四王五 的 标题和内容了。。。。
目前,我是没有想到。。。。。。弱弱地请教大家可行不? 两种方法,一种写程序,在前期合必10页的数据.然后再采集那个采集的页面,循环匹配.
另一种大同小异.在接口中判断id是否能被10整除.如果真则将取此id前10id的数据,合必到此id,必清除前10id的数据.即可 看来你的两种方法我都没办法用了。。。我不会写接口文件了。。。。 米银来探讨这个问题来? 有点深澳,不懂,努力学习 可以关于某个数据库字段来判断吧,最近也在研究这个,但是手上没有数据库编辑,有条件的可以试试,也可以联系我,给我个人版本研究研究 采集能采成这样也不错了。 刚刚想了一下,以为能用多页采集合并的,但试过了没有用,多页的只能测试一个网址,不能多个,如果多页的能多个网址的话就没有问题了。
页:
[1]