davidhehq 发表于 2008-4-8 16:30:12

任务采集不稳定的问题---有的页面能正常采集,有的页面不能正常采集

我今天刚开始用火车头,我做了一个测试,以sina的job列表,我做了一个测试任务。

对了,软件版本是3.2SP5。

对于http://career.sina.com.cn/job_info.php?jid=411,能够正常采集。

采集结果:
【招聘人数】: 1
【具体要求】: 1、负责房产频道日常新闻的发布、内容维护;
<br>2、负责房产频道专题、栏目的策划、组织和维护;
<br>3、审核发表文贴、图片,参与频道建设和整改;
<br>4、配合公司对外推广活动的策划与执行,协助完成运营规划设计目标等工作。
【截至日期】: 2008-05-30
【部门】: 房产(事业部)
【开始日期】: 2008-03-31
【岗位职责】: 1、本科以上学历,新闻、中文或其他相关专业,具有良好中文写作能力,英语程度在四级以上;
<br>2、熟悉国内外重大房产新闻事件和背景,对业内有基本了解,具备强烈的信息敏感度;
<br>3、具有独到的创新思想和优秀的选题策划能力,并有一定的组织协调能力;
<br>4、熟悉电脑操作,掌握基本网络知识。熟悉Photoshop、Dreamweaver等软件、有网页设计制作经验者优先;
<br>5、一年以上工作经验,有相关传统媒体工作经验或大型网站编辑经验者优先考虑;
<br>6、工作责任心强,愿意接受挑战,可以接受加班、值夜班,具备团队合作精神。
【标题】: 房产-高级编辑
【来源】:

可以看到,【具体要求】和【岗位职责】正常采集下来了。



但是,对于http://career.sina.com.cn/job_info.php?jid=413,就无法正常采集。

采集结果:
【招聘人数】: 若干
【具体要求】:
【截至日期】: 2008-05-30
【部门】: 桌面事业部(事业部)
【开始日期】: 2008-03-31
【岗位职责】:
【标题】: 桌面事业部-高级开发工程师

可以看到,【具体要求】和【岗位职责】就没有采集下来。


我测试的结果是,我测试了66个页面,35%能够正常采集,但是有65%采集是上面的错误----,【具体要求】和【岗位职责】就没有采集下来。

奇怪的问题是,只有【具体要求】和【岗位职责】两个标签采集有问题,别的标签采集都没有问题。

有谁遇到过这个问题?

高手和管理员解答一下???



另外两个标签的条件是:

【具体要求】
开始:<tr><td width="86" align="right" valign="top">具体要求:</td>
结束:<br></td></tr>

【岗位职责】
开始:<tr><td width="86" align="right" valign="top">岗位职责:</td>
结束:<br></td></tr>

[ 本帖最后由 davidhehq 于 2008-4-8 16:35 编辑 ]

davidhehq 发表于 2008-4-8 16:42:48

顶一个!

davidhehq 发表于 2008-4-9 14:35:42

没人知道?再顶!

davidhehq 发表于 2008-4-11 16:32:16

再顶。

davidhehq 发表于 2008-4-13 14:49:48

kuang ding
页: [1]
查看完整版本: 任务采集不稳定的问题---有的页面能正常采集,有的页面不能正常采集