2010sp1不能采集内容分页的ＢＵＧ

9o8i7u 发表于 2010-6-23 00:36:35

采集页面测试可以正常显示出分面地址，但是采集的内容，却没有分面的内容，
2010sp1是全新安装的，
如图.

lxy2010 发表于 2010-6-23 13:25:03

这个不是bug，在这个页面http://edu.itbulo.com/200509/52056.htm里包含分页http://edu.itbulo.com/200509/52056_2.htm，你可以看到这两页的地址不一样，而这个页面的52056_2.htm地址不属于列表页，在列表页采集的时候得到的是52056.htm这个地址。在测试的时候你只能看到52056.htm这个列表页里有分页/52056_2.htm，而不能看到这个页面的内容。要想看到分页的内容你可以地址http://edu.itbulo.com/200509/52056_2.htm写在典型页面上，这样才可以看到分页的内容。

9o8i7u 发表于 2010-6-24 00:11:53

首先，感谢客服人员的回复。
虽然绕来绕去我没太明白。

上面的地址http://edu.itbulo.com/200509/52056.htm明明已经是内容页了，内容页的下一页，当然和上一页的地址不同啊，相同不就是同一页面了？

注意问题：我已经设置好了主题，内容，和内容页的分页规则。但不能采到内容页的分页第二页，第三页。

在列表页采集的时候得到的是52056.htm这个地址。在测试的时候你只能看到52056.htm这个列表页里有分页/52056_2.htm，而不能看到这个页面的内容

首先，正式采集时，2010SP152056_2.htm页面内容也不能采集到。(虽然分析到了内容页的下一个分页)
第二，使用2009SP4版，按上面的设置，能分析出有分页来时，就可以在“典型页面”测试中，采集到分页内容，正式采集也能采到，

我2010SP1和2009SP4 全部重新安装，全部同样设置，2010不能采到分页内容，2009SP4能采集到，还不能说明此BUG？

请问客服人员你们有正式的试个这个网站和页面吗？？

要想看到分页的内容你可以地址http://edu.itbulo.com/200509/52056_2.htm写在典型页面上，这样才可以看到分页的内容。
这句话－－> 为什么我用2010SP1测试新浪网新闻（你们的版本中集中的），我可以在“典型页面”处采到分页？(当然要先设置好分页规则)；另外，再说一片，用2009SP4可以采集到分页内容，在“典型页面”测试时。

hssl 发表于 2010-6-24 16:13:59

采集内容页的分页的时候，需要注意的是，首先要得到每页的地址，其次标签里的规则设置是否适合于每一页。比如第一页可以匹配到，第二页，第三页....是否可以匹配，可以把第二页，第三页...的地址放到典型页面那里测试。然后，标签里要选择“该标签在分页中匹配”选项。

chyy 发表于 2010-6-27 11:32:15

解答得不错支持一下呵呵

aaiirr1 发表于 2010-7-3 00:48:51

ali76ls！很好用！学习了！原来我是一直都没有选中“该标签在分页中匹配”！！！！这个问题我想了3天！

gouso 发表于 2010-7-26 08:38:15

一句话就解决问题，为什么搞那么常的解释我，郁闷
选择“该标签在分页中匹配”选项。

wanxwan 发表于 2012-6-21 13:50:31

衷心谢谢解答！真是很好的答案！

页: [1]

火车采集器软件交流官方论坛's Archiver

2010sp1不能采集内容分页的ＢＵＧ