火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 1914|回复: 3

谁能采集到这个网页的内容,谁才是真正的采集牛人

[复制链接]
发表于 2010-8-12 13:57:11 | 显示全部楼层 |阅读模式
今天不小心看到这个网页的源代码~~~

http://222.35.76.135/cafta/(4ydzeyi30y3i0545d1wkfm45)/SecondPage.aspx?ID=5782&sqls=DayNews

日了~~~、

谁有本事采集它的文章内容,

并把方法贴出


俺就服了,牛人~~
发表于 2010-8-12 14:35:45 | 显示全部楼层
这个可以采集的到,用post方式采集网址,以这个http://222.35.76.135/cafta/(q3zoedm220hq5if4j4mwy555)/Default.aspx网页中的每日新闻为例,每日新闻网址为http://222.35.76.135/cafta/(q3zoedm220hq5if4j4mwy555)/IndexMoreList.aspx?tn=DayNews&pid=0,由于分页为550页,采集需要一些时间,现以采集前10页为例。具体的方法请看图:


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2010-8-12 15:42:57 | 显示全部楼层
至于内容页的采集目前有些难度,这个网站的内容时经过编译的,要用到插件进行处理,具体可以参考http://wiki.locoy.com/doc-view-64.htm
 楼主| 发表于 2010-8-13 01:49:39 | 显示全部楼层
噢也~~搞顶了,谢谢
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-28 22:40

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表