火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 17217|回复: 16

[栏目自动归类教程]&DEDE小说采集演示教程

 关闭 [复制链接]
发表于 2008-2-2 04:47:21 | 显示全部楼层 |阅读模式
自动归类是火车采集器的一些高级应用,特别适合建立网站栏目后,从目标网站实现自动更新!
以前做过一个软件站自动归类的教程,考虑到技术问题,所以没有给大家讲得很详细,同时,技术也不是很成熟,火车也没有有往这方面靠拢。
因为工作的原因,需要每天更新大量的数据,如果按每个栏目建立一个规则进行更新,我们可能要开上几百个规则做更新,所以这不现实。
又因为帮朋友做DEDE的小说站(在这里恶心一句,DEDE论坛的人真是垃圾,其它的不说,目前这些技术不想往DEDE传),所以开始潜心研究归类的方法到目前为止,技术基本上是成熟了,轻易实现成百上千个栏目的发布,理论上支持数万个,DEDE的小说模型就是一个例子。
基本方法如下:
一,采集并发布小说标题,包括标题,简介,时间等一些基本属性,然后,我们会得到这个小说标题生成的ID数据,包括栏目ID和文档ID,这个可以通过Mysql轻松导出Access,这样可以轻松处理。
二,采集小说章节,注意采集到小说章节所属标题,栏目等,因为在后面的操作中会使用到这两个参数,因为小说的数据量极大,几百部小说便是几百M,这个太牛了。然后呢,将我们获取到的ID值和小说章节按对应的标题进行整理,使小说章节正确更新所属栏目ID文档ID,这样,数据库就相当完整了,之后,就是大家十分熟悉的操作了!
今天是为了送给朋友一个好消息,才做了这个演示教程,因为答应帮他做小说站,已经拖了一个月有余了,爽快而脆弱的好朋友,我不忍心伤害他,呵呵,同时,也给大家一些小小的思路。
过几天放假回来,我会抽时间做一个完完整整的教程,帮助大家实现更加方便,更加快速的,更加NB的使用体验!

点击这里观看视频教程:火车采集器实现[栏目自动归类教程]DEDE小说采集演示教程

[ 本帖最后由 vus520 于 2008-2-2 04:49 编辑 ]

评分

1

查看全部评分

发表于 2008-2-2 09:15:39 | 显示全部楼层
支持,入庫可以實現的,我以前也做過類似的
发表于 2008-2-2 09:53:18 | 显示全部楼层
当然支持啦  
发表于 2008-2-2 12:08:17 | 显示全部楼层
顶,老大的教程一直不错。支持一下。
发表于 2008-2-2 14:59:26 | 显示全部楼层
高手总是这样的.

羡慕啊.

崇拜中
发表于 2008-2-15 14:22:24 | 显示全部楼层

kankan

kankan
发表于 2008-2-16 14:14:59 | 显示全部楼层
谢谢共享
发表于 2008-3-1 10:01:45 | 显示全部楼层
先顶再下,, 正想学这个
发表于 2008-3-6 15:28:47 | 显示全部楼层
发表于 2008-4-2 17:35:34 | 显示全部楼层
谢谢,,不过视频好像都是采集好的..有没有完整的啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-3-30 22:52

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表