火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 7883|回复: 9

请问如何采集类似于下面文中提到的页面?

[复制链接]
发表于 2007-11-11 16:44:51 | 显示全部楼层 |阅读模式
1火车车厢
这个就没办法采集~好郁闷~~似乎是用js代码调用的 ~无法采集~~


http://eat.sina.com.cn/more/xxcq.html

帮帮忙~可以的把采集的规则发给我~

或是在回帖中做详细的解析~~

似乎还不太好 ~没有很好的解决 分页问题~

[ 本帖最后由 ddol 于 2007-11-12 23:10 编辑 ]

最佳答案

查看完整内容

采集规则写好了 下载链接 http://bbs.locoy.com/spider-20316-1-1.html 其实很简单的,不用管下一页的 所有文章链接都在第一页 列表的文章链接要手动填写,火车头自动分析不出来 建议你看看这个教程 第一期培训教程系列之六【正则采集网址及使用教程】 http://bbs.locoy.com/spider-19972-1-1.html [ 本帖最后由 bisn 于 2007-11-11 19:09 编辑 ] ...
发表于 2007-11-11 16:44:52 | 显示全部楼层
采集规则写好了
下载链接
http://bbs.locoy.com/spider-20316-1-1.html

其实很简单的,不用管下一页的
所有文章链接都在第一页
列表的文章链接要手动填写,火车头自动分析不出来
建议你看看这个教程
第一期培训教程系列之六【正则采集网址及使用教程】
http://bbs.locoy.com/spider-19972-1-1.html

[ 本帖最后由 bisn 于 2007-11-11 19:09 编辑 ]
 楼主| 发表于 2007-11-11 20:02:57 | 显示全部楼层
大致知道了 但是有些网址 没采集到
不如
http://eat.sina.com.cn/art/2007-10-31/143133373.shtml
其他几个页面都没采集到~??按你给的 规则,采集到的网址只有四百个 ,我倒出来之后搜索了下没有相关的 页面的 网址~希望一并解决 ?
发表于 2007-11-11 20:46:09 | 显示全部楼层
你给的列表页面(http://eat.sina.com.cn/more/xxcq.html)正好有400条,不信你数下

晕倒,有分页
我修改下规则

[ 本帖最后由 bisn 于 2007-11-11 20:53 编辑 ]
发表于 2007-11-11 20:52:59 | 显示全部楼层
好了
已经修改
下载链接
http://bbs.locoy.com/spider-20316-1-1.html
 楼主| 发表于 2007-11-11 21:43:04 | 显示全部楼层
谢谢 ~~就是不会用分页!还有这种比较有难度的采集方法~谢谢~~
火车头随后就到~
 楼主| 发表于 2007-11-11 21:47:08 | 显示全部楼层
不对啊 ~用新的那个 测试采集到的页面也才400个~不够啊~~
发表于 2007-11-12 08:31:50 | 显示全部楼层
页面只有400页,好多分页只能算一个页面,汗!
发表于 2007-11-12 09:46:04 | 显示全部楼层
好东东呀!
发表于 2007-11-14 14:27:09 | 显示全部楼层
一开始我孔洞知道分页要怎么采集,现在知道了!谢谢!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 02:44

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表