火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2272|回复: 5

关于采集b2b网站的思考

[复制链接]
发表于 2009-11-27 11:27:33 | 显示全部楼层 |阅读模式
b2b网站有企业资料供求信息相应的行业分类信息等。
如果自己是b2b的网站,如果单独采集企业资料 联系方式 简介之类的用多页采集并不困难,
如果采集供求信息 产品说明 图片之类的,也不困难。
但是要把这两者连起来我却想不到什么好办法了,因为企业信息是分页的(简介,联系方式等),产品也是多条的(再次分页)且目录层次可能达到三级或者以上,如何把他们给对应起来呢? 不知道哪位高手有好的方法或者经验,分享一下啊。
发表于 2009-11-27 11:33:00 | 显示全部楼层
第一步就错了,以后的路自然不通畅
发表于 2009-11-27 15:12:17 | 显示全部楼层
个人想法:这是一个全局匹配的问题,以某一个字段作为唯一值 所有的数据围绕着来做,自己建表然后分类类似api 的调用,不行在匹配插入,最后的办法就是的就一批一批入库了
 楼主| 发表于 2009-11-27 16:34:14 | 显示全部楼层
2# 连通
老手介绍一下经验啊。
发表于 2009-11-28 12:41:40 | 显示全部楼层
我也在采阿里巴巴的, 用destoon程序
 楼主| 发表于 2009-11-29 13:05:34 | 显示全部楼层
楼上大哥 可否介绍一二啊。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-29 19:19

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表