火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2262|回复: 5

这个网址能采吗?源码看不到文章列表。

[复制链接]
发表于 2011-7-26 15:35:47 | 显示全部楼层 |阅读模式
http://roll.news.sina.com.cn/s/channel.php?ch=12#col=134&spec=&type=&ch=12&k=&offset_page=0&offset_num=0&num=60&asc=&page=1
发表于 2011-7-26 15:54:56 | 显示全部楼层
能采的。有什么要求呢
 楼主| 发表于 2011-7-26 16:11:13 | 显示全部楼层
本帖最后由 dony 于 2011-7-26 16:12 编辑

我刚用采集不懂啊。不知道用什么方法采这种网页,总是数据0.

请问我怎么能请求到文章列表。
 楼主| 发表于 2011-7-26 17:39:39 | 显示全部楼层
高手帮看看吧。给2句话思路。新浪好像就这1个频道这么写的。
发表于 2011-7-26 18:04:30 | 显示全部楼层
回复 1# dony


    可以采集到,使用fidder抓包工具抓取下就明白了。列表页地址都在var jsonData = { serverSeconds : 1311674549, last_time : 1311268824, path : [{title : "台式机", id : "134", cType : "col"}], count : 285, offset_page : 0, offset_num : 0, list : [ {channel : {title : "台式机",id : "134",cType : "col",url : "http://tech.sina.com.cn/pc/"},title : "强劲配置 宏碁Aspire M3920售6173元",url : "http://tech.sina.com.cn/pc/2011-07-22/01201828087.shtml",pic : '',time : 1311268824}, {channel : {title : "台式机",id : "134",cType : "col",url : "http://tech.sina.com.cn/pc/"},title : "时尚急速 联想B320畅速型售价4999元",url : "http://tech.sina.com.cn/pc/2011-07-22/01201828083.shtml",pic : '',time : 1311268823}, {channel : {title : "台式机",id : "134",cType : "col",url : "http://tech.sina.com.cn/pc/"},title : "时尚大气娱乐机 联想B520飚速型售6999",url : "http://tech.sina.com.cn/pc/2011-07-22/01201828099.shtml",pic : '',time : 1311268822}, {channel : {title : "台式机",id : "134",cType : "col",url : "http://tech.sina.com.cn/pc/"},title : "商务品
这里

GET http://roll.news.sina.com.cn/int ... 0.21327521756443835 HTTP/1.1
Accept: */*
Referer: http://roll.news.sina.com.cn/s/channel.php?ch=12


使用这个地址匹配采集http://roll.news.sina.com.cn/int ... 0.21327521756443835
 楼主| 发表于 2011-7-26 18:47:15 | 显示全部楼层
老大,太感谢了,你说的我已经弄出来了。
现在使用这个地址采集,但是我不知道怎么识别连接。。。。。。。
就是怎么匹配,再多说1句,就彻底明白了。。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-11 23:03

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表