火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2780|回复: 1

付费任务悬赏:请人帮忙采集数据

[复制链接]
发表于 2016-7-2 21:37:29 | 显示全部楼层 |阅读模式
任务描述如下:(高手请加QQ:38246965或微信号:fx_87654321)
某图书数据采集需求
1.从网络上采集相关图书信息,存放在本地数据库
2.所需采集字段:
书名、作者、ISBN号、定价、包装、出版社、出版时间、版次、页数、开本、语种、印刷时间、印次、丛书名、所属分类、封图、编辑推荐、名人推荐、内容推荐、作者简介、目录、商品尺寸、商品重量、分类标签
某指定图书网站

3.采集图书分类的路径
如:经济管理——经济学理论与读物——经济学基础理论

4.交付采集规则和工具方法,能采集所需数据


另外长期招聘专兼职(工作地点:广州天河区  有意请将简历发至邮箱hjzp@haojuetech.com)。
岗位职责描述如下:
岗位职责:
1、负责设计和开发分布式网络爬虫系统,进行多平台信息的抓取和分析;
2、负责网页信息抽取、数据清洗等研发和优化工作;
3、负责抓取数据的深度提取和挖掘;
4、负责系统日常运营资源调度优化及运营指标分析调优;
5、负责特殊网页采集任务的分析及采集方案设计;
6、负责竞品分析和行业资讯采集;

岗位要求:
1、熟悉HTTP传输协议,能模拟浏览器操作爬虫;
2、精通网页抓取原理及技术,精通正则表达式,从结构化的和非结构化的数据中获取信息;
3、至少精通一种关系型数据库的开发,如MYSQL等;
4、有爬虫,信息抽取,文本分类相关经验者优先;
5、有责任心,学习能力强,具有良好的团队合作精神,对工作有热情;
6、具有良好的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;
7、专/兼职皆可,欢迎在校生实习兼职

头像被屏蔽
发表于 2016-7-5 10:37:47 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 23:57

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表