bvc00052 发表于 2008-11-21 12:01:45

为什么火车头检测到有几页,可是采集发布时老是少最后一页的?

████████████████████████████████████
█此页面包含多个分页:
█1:http://xxxxx.com/Html/qingchun/200807040256.html
█2:http://xxxxx.com/Html/qingchun/200807040256_2.html
█3:http://xxxxx.com/Html/qingchun/200807040256_3.html
█4:http://xxxxx.com/Html/qingchun/200807040256_4.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
【作者】:
【出处】:
【标题】: MM
【内容】: <P align=center><IMG alt=MM src="http://xxxxx.com/200807/002/BigBull_1.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_2.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_3.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_4.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_5.jpg"></P>
</P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_6.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_7.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_8.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_9.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_10.jpg"></P>
</P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_11.jpg"></P>
<P align=center><IMG src="http://xxxxx.com200807/002/BigBull_12.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_13.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_14.jpg"></P>
<P align=center><IMG src="http://xxxxx.com/200807/002/BigBull_15.jpg"></P>

bvc00052 发表于 2008-11-21 12:02:19

如上面说有4页,可是发布时只发前面三页,是什么原因?

rq204 发表于 2008-11-21 12:39:19

从你帖的内容看来,你的规则有问题,测试那里获取得内容就不全,只有3页的.请仔细修改下规则.

bvc00052 发表于 2008-11-21 13:03:57

管理员好热心,好像每次你都有回复的
我又花了一个上午时间研究采集,其中一直在研究发布内容时,想让内容显示分页,结果研究不出来,后来又发现采的图又不全。
rq204管理员帮我看下,我觉得好像没什么问题呀,分页的代码是:
<P align=center><b><p><div align="center">本套图片共<font color=red>3</font>页,当前在第<font color=red>2</font>页&nbsp;&nbsp;<a href="200807131834.html" class="topfont">上一页</a>&nbsp;&nbsp;<a href="200807131834.html"></a>&nbsp;&nbsp;<font color="red"></font>&nbsp;&nbsp;<a href="200807131834_3.html"></a>&nbsp;&nbsp;<a href="200807131834_3.html" class="topfont">下一页</a>&nbsp;&nbsp;</div></p></b><Script src="/gg.js"></Script></div>

而我用全部列出模式:
从<P align=center><b><p><div align="center">本套图片共<font color=red>到&nbsp;&nbsp;</div></p></b>

bvc00052 发表于 2008-11-21 13:06:06

上面这样的设置用verycms自带采集测试出是没有问题的,自带的发布后内容会按采源页那样自动分页,而我在火车头就不会实现内容分页。

bvc00052 发表于 2008-11-21 13:43:29

奇怪的是,我测试别的分页站,好像也是这样写的,也正常呀,就是这个站这样

沦陷今生 发表于 2008-11-21 15:12:40

测试内容的时候,是否所有分页里的数据都匹配出来了呢

bvc00052 发表于 2008-11-21 15:58:10

哈哈,非常感谢两位管理员的帮助

今生管理员一语提醒梦中人呀,我采那个页面时我不会想到最后一页和之前几页的分页代码有些差别的,所以经过设置可以成功了。

对了,我还想请教,就是采集成功后,一般都是合成或新纪录发布,而我用的verycms好像还不知道分页标签是多少,你们知道的话可以告诉我吗?我正在看源代码,想找出那分页标签函数找出来试试。
页: [1]
查看完整版本: 为什么火车头检测到有几页,可是采集发布时老是少最后一页的?