火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2660|回复: 3

探讨系统标签和自定义标签的问题

[复制链接]
发表于 2008-9-4 13:02:14 | 显示全部楼层 |阅读模式
不知道各位有没有遇到这样的问题,在采集规则中某些标签在规则相同的时候,包括还是和结束字符串、分页等
采集的结果却大部相同
比如我采集http://newspic.cn.yahoo.com/pets/article/index.html?type=gallery_show&p=62112 这样地址内的图片

我本来已经成功的将图片链接和分页都设置好了,除了图片有图片重复未解决以外,可以说内容都采集到了

其实我的真实目的仅仅是采集到http://cn.yimg.com/gallery/pets/200710191357516211211.jpg这样的图片地址,
并希望将标签命名为【图片地址】而不是【内容】,前提是除了改换标签名字之外没有改变任何其他设置

结果是只采集到第一个页面的图片地址,反而分页规则不起作用了(当然,我也可以不改变【内容】标签名称解决,只是借此更深一步了解火车头)

我的问题是,难道规则相同换个标签名称就需要改变整个结果吗?这是因为系统标签和自定义标签的问题吗?
不知到各位高手怎么看?

另外,如果高手们能帮我看看采集内容中图片地址重复的问题该如何解决,小弟将感激涕零!!


  1. </div><div class="cnt_r_cnt">
  2. <div class="cnt_r_img"><a href="javascript:nextpage();"><img src="http://cn.yimg.com/gallery/pets/200710171007426147922.jpg" border="0" alt="点击图片查看下一幅" width="500" height="375" /></a></div><div style="font-size:14px;text-align:center; margin-top:5px; margin-bottom:5px;"><img src="http://cn.yimg.com/i/news/pics/ico/03.gif" border="0" align="absbottom"><a href="javascript:nextpage()">点击图片查看下一幅</a> | <img src="http://cn.yimg.com/i/news/pics/ico/01.gif" border="0"><a href="http://cn.yimg.com/gallery/pets/200710171007426147922.jpg" target="_blank">查看原图</a> | <img src="http://cn.yimg.com/i/news/pics/ico/04.gif" border="0" align="bottom"><a href="javascript:play()">自动播放</a></div></div>
  3. <div class="cnt_r_cnt">
  4. <table width="100%" border="0" cellspacing="0" cellpadding="0" align="center" style="margin-top:10px; margin-bottom:10px;">
  5. <tr>
  6. <td><font style="font-size:14px;"><b>图解:</b>装可爱的眼神...</font></td>
  7. </tr>
  8. </table>
  9. </div><div class="page">
  10. <div class="page_cnt">
  11. <a href="http://newspic.cn.yahoo.com/pets/article/gallery_show/p_61479/"><img src="http://cn.yimg.com/i/news/pics/btn/05.gif" border="0" /></a>
  12. <a href="javascript:lastpage();"><img src="http://cn.yimg.com/i/news/pics/btn/02.gif" border="0" /></a>
  13. <a href="http://newspic.cn.yahoo.com/pets/article/gallery_show/p_61479/page_0/" class="linkc">1</a> <span style="font-weight:bolder;color:#69A33F;line-height:24px;" >2</span> <a href="http://newspic.cn.yahoo.com/pets/article/gallery_show/p_61479/page_2/" class="linkc">3</a> <a href="http://newspic.cn.yahoo.com/pets/article/gallery_show/p_61479/page_3/" class="linkc">4</a> <a href="http://newspic.cn.yahoo.com/pets/article/gallery_show/p_61479/page_4/" class="linkc">..</a><a href="javascript:nextpage();"><img src="http://cn.yimg.com/i/news/pics/btn/03.gif" border="0" /></a>
  14. <a href="http://newspic.cn.yahoo.com/pets/article/gallery_show/p_61479/page_8/"><img src="http://cn.yimg.com/i/news/pics/btn/07.gif" border="0" /></a>
  15. </div>

复制代码

[ 本帖最后由 dumu 于 2008-9-4 13:14 编辑 ]
发表于 2008-9-4 13:28:16 | 显示全部楼层
采集多个分页的 需要在标签那要勾选此标签在分页中匹配
 楼主| 发表于 2008-9-4 13:34:41 | 显示全部楼层
谢谢火车头老大,我去试试
 楼主| 发表于 2008-9-4 13:48:28 | 显示全部楼层
不过我使用的是3.2SP5,没有这个选项,而用2008却始终显示无法登陆,我发布目标站是SS6程序
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-19 23:15

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表