吹雪丸 发表于 2007-5-22 09:58:29

一下采到几万个内容页!怎办好???

今天用火车采了几百个网页保存为html在本地磁盘里,可是要把这些网页用一个网页连起来还真麻烦,如果采了几万个网页,这样一个一个地添加超连接,汗!!!
请问各位采集的高手、前辈们有没有批量加超连接的方法?

吹雪丸 发表于 2007-5-22 10:04:50

另外问一下,可否采本地的网页?我试了一下,好像采不到呢。

天毅 发表于 2007-5-22 13:57:52

为什么不入库呢?

吹雪丸 发表于 2007-5-22 17:49:55

原帖由 天毅 于 2007-5-22 13:57 发表
为什么不入库呢?

还没装服务器的。

skyson 发表于 2007-5-23 10:20:51

可以用字典,或者你自己弄个php环境

吹雪丸 发表于 2007-5-23 11:15:49

原帖由 skyson 于 2007-5-23 10:20 发表
可以用字典,或者你自己弄个php环境

已经装了AppServ,用火车采集,然后导入到dedecms可以吗?

天毅 发表于 2007-5-23 13:26:53

回复 #6 吹雪丸 的帖子

可以直接模拟发布(用登录模块)
或者直接mysq入l库

吹雪丸 发表于 2007-5-24 19:54:54

原帖由 天毅 于 2007-5-23 13:26 发表
可以直接模拟发布(用登录模块)
或者直接mysq入l库

谢谢老大教导!我用hphmyadmin建了一个空的数据库,但是那些数据表不知道怎样弄,测试了一下,无法导入到数据库。如果真的导入到数据库后要怎样才能把里面的网页弄出来?我现在装了一个hbcms,还不知道怎样用,正在学习中。。。
本来想装dedecms的,但装不了,连discuz!论坛也装不了,我的php环境是用hphstudy(Apache+PHP+MySQL+ZendOptimizer)装的,之前用AppServ(Apache+PHP+MySQL+phpMyAdmin)装php环境倒是可以装。

[ 本帖最后由 吹雪丸 于 2007-5-24 19:58 编辑 ]

吹雪丸 发表于 2007-5-28 13:04:52

已经可以成功采集并导入到CMS里自动更新网站了!!!

谢谢上面指点、帮助过丸的朋友,以及发表意见和建议的朋友,还有看帖与回帖的朋友,谢谢大家!!!
页: [1]
查看完整版本: 一下采到几万个内容页!怎办好???