火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3003|回复: 9

新浪博客怎么采集呢?

[复制链接]
发表于 2012-5-16 16:03:09 | 显示全部楼层 |阅读模式
求高手指点,新浪博客怎么采集呢?不管规则怎么配,采的内容都是空。难道新浪博客的防采集已经做到无人可破的程度了吗?我的站(www.heshib.net)跟新浪旅游相关性很大,很想采集到它的内容,求助{:soso_e163:} 先送花,嘿嘿
发表于 2012-5-17 11:35:15 | 显示全部楼层
才以 http://travel.sina.com.cn/109/blog/chn/list.html 这个网址为例看了一下。
里面的博客的列表是通过js代码动态显示的(姑且这样描述,可能有误,望高手指正)。所以采集时会为空。

不过看了下源代码,实际上不用写插件,稍微用工具处理下即可。具体如何做,晚点写篇博文出来放这。
 楼主| 发表于 2012-5-17 11:42:17 | 显示全部楼层
negatlov 发表于 2012-5-17 11:35
才以 http://travel.sina.com.cn/109/blog/chn/list.html 这个网址为例看了一下。
里面的博客的列表是通过 ...

嗯嗯,那太感谢了,在线等指教
发表于 2012-5-17 23:44:37 | 显示全部楼层
本帖最后由 negatlov 于 2012-5-17 23:46 编辑

不好意思,白天有点事,现在才回来写晚。教程放博客里了。
http://blog.csdn.net/datacollection/article/details/7578198

这是演示例子中的规则:


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2012-5-18 11:42:23 | 显示全部楼层
本帖最后由 lsnmc2011 于 2012-5-18 13:04 编辑

谢谢哦{:soso_e128:}
 楼主| 发表于 2012-5-18 13:15:41 | 显示全部楼层
negatlov 发表于 2012-5-17 23:44
不好意思,白天有点事,现在才回来写晚。教程放博客里了。
http://blog.csdn.net/datacollection/article/ ...

谢谢啦。不过我按照你的那个规则配的,还是采集不到内容啊,有什么特别需要设置的吗?
发表于 2012-5-18 20:43:54 | 显示全部楼层
楼上可以多看看些采集实例,重简单的开始。慢慢的就学会了。我博客现在有两例子,论坛也有些教程哦。
发表于 2012-5-18 20:44:46 | 显示全部楼层
lsnmc2011 发表于 2012-5-18 13:15
谢谢啦。不过我按照你的那个规则配的,还是采集不到内容啊,有什么特别需要设置的吗?

楼主可以截个图啊什么的看看。按那教程所说,应该无问题。
 楼主| 发表于 2012-5-22 11:08:45 | 显示全部楼层
本帖最后由 lsnmc2011 于 2012-5-22 11:12 编辑
negatlov 发表于 2012-5-18 20:44
楼主可以截个图啊什么的看看。按那教程所说,应该无问题。


这两个截图是按照那个规则配的,测试采集什么都没有,是我哪里配错了吗?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2012-5-25 11:55:35 | 显示全部楼层
不错啊


  南宁500505社区:http://www.500505.com
  淘啊呀女装购物网:http://www.taoaya.com
  淘虾虾减肥官方网:http://www.taoxiaxia.com
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-25 20:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表