火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2385|回复: 2

请教采集条目不完全相同时怎样设定规则

[复制链接]
发表于 2008-9-4 11:13:14 | 显示全部楼层 |阅读模式
http://www.socolar.com/pl.aspx?Page=4&ClassCode=CH&CName=%e5%8c%96%e5%ad%a6,我想提取刊名及刊名对应的地址(指Visit Web site 所对应的链接),但是有的条目没有“Visit Web site 所对应的链接”这项(如该页倒数第三项Research Journal of Applied Sciences 仅有刊名,没有地址链接  ),这种情况下怎样设定规则,才能使所提取的刊名和地址是对应的(刊名中没有对应地址的仅要刊名,对应的地址为空)

[ 本帖最后由 purple01 于 2008-9-4 17:10 编辑 ]
发表于 2008-9-4 11:21:40 | 显示全部楼层
像这种情况是非常少的,你可不用管它。完全按照有 Visit Web site  的去写 。这样你丢失了部分信息 ,可以再用另外的规则找回来。
 楼主| 发表于 2008-9-4 11:28:50 | 显示全部楼层
原帖由 蒸汽机 于 2008-9-4 11:21 发表
像这种情况是非常少的,你可不用管它。完全按照有 Visit Web site  的去写 。这样你丢失了部分信息 ,可以再用另外的规则找回来。

感谢蒸汽机兄的指导,但是我按照有 Visit Web site  的去写时,在采集内容规则下我选中了“该标签循环匹配”,所得的刊名和地址不是一一对应的,怎样设置才能保证使获得的刊名和地址是一一对应的?

[ 本帖最后由 purple01 于 2008-9-4 15:14 编辑 ]
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-19 23:14

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表