火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4212|回复: 9

51.com中博客的标题如何采集啊?急急急~!!

[复制链接]
发表于 2008-9-28 23:50:54 | 显示全部楼层 |阅读模式
谁谁知道51博客中的标题如何采集啊??帮忙解决这个问题啊!!
如:http://home.51.com/cn16888 它的标题是:華麗苦都
在这里如何采集其他51博客中的这个标题啊??
请各位大侠不要说简单~!!
请求留下采集这个标题的实际方法~!!@在下感激不尽~@@
发表于 2008-9-29 00:24:11 | 显示全部楼层
不懂,没有采集过这种,你这种属于是一个博客的名字了。
 楼主| 发表于 2008-9-29 00:35:30 | 显示全部楼层
原帖由 chenfy 于 2008-9-29 00:24 发表
不懂,没有采集过这种,你这种属于是一个博客的名字了。

你光做广告~!不解决问题~~!鄙视你~@@像你这种广告大侠~!!真可恶~!!
发表于 2008-9-29 02:17:36 | 显示全部楼层
我看了一下,采到标题还是挺容易吗。

只不过是个多页采集外加unicode转码罢了!

多页采集的文件是经unicode编码的js文件

得到的文件内容全如类似

\u83ef\u9e97\u82e6\u90fd等unicode后的

须在接口文件中改造一下,我写了一个小函数

可以使unicode正确转码为gbk或utf8等。


用08版才能采到哦。规则我就不上传了,上两个图吧


多页采集设置:


采集结果标题:




函数转码后标题:








[ 本帖最后由 aven 于 2008-9-29 02:20 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

2

查看全部评分

发表于 2008-9-29 11:39:03 | 显示全部楼层
果然是高手都是低调的。
我把楼主的接着简单化下。
用楼上的方示得到unicode符,再下载张unicode符表,
制做成火车头替换格式 "01→1○02→2○"。在mdb文件中导入。
 楼主| 发表于 2008-9-29 12:21:14 | 显示全部楼层
原帖由 aven 于 2008-9-29 02:17 发表
我看了一下,采到标题还是挺容易吗。

只不过是个多页采集外加unicode转码罢了!

多页采集的文件是经unicode编码的js文件

得到的文件内容全如类似

\u83ef\u9e97\u82e6\u90fd等unicode后的

须在接口文件 ...

谢谢大侠~!了~!!果然是高手~@@谢谢~@!@
发表于 2008-12-20 09:55:09 | 显示全部楼层
看不清,说好点。真的是
发表于 2008-12-20 10:31:19 | 显示全部楼层
unicode符原来你也是一种语言啊。
发表于 2008-12-20 18:54:03 | 显示全部楼层
牛X不是吹的
火车不是推的。。。
发表于 2008-12-21 09:58:09 | 显示全部楼层
kwg kwg 一哈。xiong ge 您厉害啊
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-24 00:12

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表