[栏目自动归类教程]&DEDE小说采集演示教程
自动归类是火车采集器的一些高级应用,特别适合建立网站栏目后,从目标网站实现自动更新!以前做过一个软件站自动归类的教程,考虑到技术问题,所以没有给大家讲得很详细,同时,技术也不是很成熟,火车也没有有往这方面靠拢。
因为工作的原因,需要每天更新大量的数据,如果按每个栏目建立一个规则进行更新,我们可能要开上几百个规则做更新,所以这不现实。
又因为帮朋友做DEDE的小说站(在这里恶心一句,DEDE论坛的人真是垃圾,其它的不说,目前这些技术不想往DEDE传),所以开始潜心研究归类的方法到目前为止,技术基本上是成熟了,轻易实现成百上千个栏目的发布,理论上支持数万个,DEDE的小说模型就是一个例子。
基本方法如下:
一,采集并发布小说标题,包括标题,简介,时间等一些基本属性,然后,我们会得到这个小说标题生成的ID数据,包括栏目ID和文档ID,这个可以通过Mysql轻松导出Access,这样可以轻松处理。
二,采集小说章节,注意采集到小说章节所属标题,栏目等,因为在后面的操作中会使用到这两个参数,因为小说的数据量极大,几百部小说便是几百M,这个太牛了。然后呢,将我们获取到的ID值和小说章节按对应的标题进行整理,使小说章节正确更新所属栏目ID文档ID,这样,数据库就相当完整了,之后,就是大家十分熟悉的操作了!
今天是为了送给朋友一个好消息,才做了这个演示教程,因为答应帮他做小说站,已经拖了一个月有余了,爽快而脆弱的好朋友,我不忍心伤害他,呵呵,同时,也给大家一些小小的思路。
过几天放假回来,我会抽时间做一个完完整整的教程,帮助大家实现更加方便,更加快速的,更加NB的使用体验!
点击这里观看视频教程:火车采集器实现[栏目自动归类教程]DEDE小说采集演示教程
[ 本帖最后由 vus520 于 2008-2-2 04:49 编辑 ] :ali12ls 支持,入庫可以實現的,我以前也做過類似的 当然支持啦ali13ls 顶,老大的教程一直不错。支持一下。 高手总是这样的.
羡慕啊.
崇拜中
kankan
kankan 谢谢共享:ali12ls 先顶再下,,:ali12ls 正想学这个 :( :( :( :( :( 谢谢,,不过视频好像都是采集好的..有没有完整的啊
页:
[1]
2