火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2626|回复: 7

58列表页提取号码不行吗?

[复制链接]
发表于 2013-3-3 17:11:56 | 显示全部楼层 |阅读模式
采集58面临的号码问题,这样操作应该怎么办呢?在http://hrb.58.com/fudao/d1/pn2/读取号码后,再进到内容页里读内容。
或者把目标页定位到内容页,再把列表页作为多页,读取号码。

但两种问题都面临着具体内容页和列表页对应对容的匹配问题,似乎用个可以在多级页面间传递的变量可以解决,求帮助。
 楼主| 发表于 2013-3-3 17:14:21 | 显示全部楼层
不知道说明白没有。
在列表页里有:
企业1  号码
企业2  号码
企业3  号码
提取完企业1和号码后,进入这个对应的链接再采集内容。这是把列表页作为默认页操作的。

第二种就是进入到具体内容页,采完内容后,把列表页作为多页,根据企业名匹配对应的行,再采集号码。

 楼主| 发表于 2013-3-3 19:15:37 | 显示全部楼层
时间不好,没人理呢?
 楼主| 发表于 2013-3-4 08:19:40 | 显示全部楼层
求灵光一闪的大侠提示
发表于 2013-3-4 08:36:08 | 显示全部楼层
用自定义链接

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2013-3-4 09:58:42 | 显示全部楼层
本帖最后由 planespace 于 2013-3-4 10:24 编辑

大概明白了,我再测试一下,感谢列车员帮助。
测试一下后,发现没明白透彻|||
这个标签XXX不是哪都有的

我能够写明白获取这些地址的操作,我的意思是如何把列表页与默认页的匹配的内容组合:
列表页里有:
url1标题1电话1
url2标题2电话2
url3标题3电话3

我到了url1里取完内容,想把列表页的电话1一起采集和内容形成一条记录。

我测试的时候,把列表页作为多页处理,会匹配从url1到url3多条记录,所以我才想到把标题作为变量在默认页和多页间传递值。
这样就是采完默认页后,再回到列表页采集标题等于内容页标题的电话;或者是在列表页采完电话后,再到标题值相同的内容页采集内容。

发表于 2013-3-4 12:27:53 | 显示全部楼层
planespace 发表于 2013-3-4 09:58
大概明白了,我再测试一下,感谢列车员帮助。
测试一下后,发现没明白透彻|||
这个标签XXX不是哪都有的

看这个教程
http://bbs.locoy.com/spider-108117-1-1.html
列表页提取字段标签值
 楼主| 发表于 2013-3-4 14:45:28 | 显示全部楼层
彻底明白了,正是我需要的,谢谢
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-15 12:05

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表