火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4313|回复: 7

为什么火车头检测到有几页,可是采集发布时老是少最后一页的?

[复制链接]
发表于 2008-11-21 12:01:45 | 显示全部楼层 |阅读模式
████████████████████████████████████
█此页面包含多个分页:
█1:http://xxxxx.com/Html/qingchun/200807040256.html
█2:http://xxxxx.com/Html/qingchun/200807040256_2.html
█3:http://xxxxx.com/Html/qingchun/200807040256_3.html
█4:http://xxxxx.com/Html/qingchun/200807040256_4.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
【作者】:
【出处】:
【标题】: MM
【内容】: <P align=center><IMG alt=MM src="http://xxxxx.com/200807/002/BigBull_1.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_2.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_3.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_4.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_5.jpg"></P>
</P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_6.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_7.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_8.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_9.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_10.jpg"></P>
</P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_11.jpg"></P>
<P align=center><IMG src="http://xxxxx.com200807/002/BigBull_12.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_13.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_14.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_15.jpg"></P>
 楼主| 发表于 2008-11-21 12:02:19 | 显示全部楼层
如上面说有4页,可是发布时只发前面三页,是什么原因?
发表于 2008-11-21 12:39:19 | 显示全部楼层
从你帖的内容看来,你的规则有问题,测试那里获取得内容就不全,只有3页的.请仔细修改下规则.
 楼主| 发表于 2008-11-21 13:03:57 | 显示全部楼层
管理员好热心,好像每次你都有回复的
我又花了一个上午时间研究采集,其中一直在研究发布内容时,想让内容显示分页,结果研究不出来,后来又发现采的图又不全。
rq204管理员帮我看下,我觉得好像没什么问题呀,分页的代码是:
<P align=center><b><p><div align="center">本套图片共<font color=red>3</font>页,当前在第<font color=red>2</font>页&nbsp;&nbsp;<a href="200807131834.html" class="topfont">上一页</a>&nbsp;&nbsp;<a href="200807131834.html">[1]</a>&nbsp;&nbsp;<font color="red">[2]</font>&nbsp;&nbsp;<a href="200807131834_3.html">[3]</a>&nbsp;&nbsp;<a href="200807131834_3.html" class="topfont">下一页</a>&nbsp;&nbsp;</div></p></b><Script src="/gg.js"></Script></div>

而我用全部列出模式:
从<P align=center><b><p><div align="center">本套图片共<font color=red>到&nbsp;&nbsp;</div></p></b>
 楼主| 发表于 2008-11-21 13:06:06 | 显示全部楼层
上面这样的设置用verycms自带采集测试出是没有问题的,自带的发布后内容会按采源页那样自动分页,而我在火车头就不会实现内容分页。
 楼主| 发表于 2008-11-21 13:43:29 | 显示全部楼层
奇怪的是,我测试别的分页站,好像也是这样写的,也正常呀,就是这个站这样
发表于 2008-11-21 15:12:40 | 显示全部楼层
测试内容的时候,是否所有分页里的数据都匹配出来了呢
 楼主| 发表于 2008-11-21 15:58:10 | 显示全部楼层
哈哈,非常感谢两位管理员的帮助

今生管理员一语提醒梦中人呀,我采那个页面时我不会想到最后一页和之前几页的分页代码有些差别的,所以经过设置可以成功了。

对了,我还想请教,就是采集成功后,一般都是合成或新纪录发布,而我用的verycms好像还不知道分页标签是多少,你们知道的话可以告诉我吗?我正在看源代码,想找出那分页标签函数找出来试试。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-28 11:27

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表