火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 7608|回复: 10

有谁能说说内容的分页原理呢?

[复制链接]
发表于 2007-2-4 19:54:30 | 显示全部楼层 |阅读模式
有谁能说说内容的分页原理呢?
发表于 2007-2-4 20:23:57 | 显示全部楼层
第二项:页面内容分页设置,用于采集有分页的内容之页面规则。
  ⑴:采集得到的内容将分为全部列出模式和上下页模式,当你所采集的网页内容在第一页有其它所有分页的链接时,请使用全部列出模式;当你所采集的页面只有上一页和下一页的链接时,请使用上下页模式。当设置完成后,所采集到的分页内容将合并成为一页。
  ⑵:内容分页区域,用于设置分页链接所存在区域的开始与结束字符串。
  ⑶:内容分页合并,用于设置将分页内容合并成为一页时,连接分页的代码,默认使用回车转行方式替换分页内容,如果你希望发页的内容也同源文件同样分页的方式,请根据不同的CMS系统设置不同的自定意分页代码。
  ⑷:标签循环匹配,用于所采集到的页面内容格式有循环的时候使用,如论坛回贴内容等。下面有三个选项,根据不同需要分别选择。

  第三项:采集页面测试,用于测试以上设置是否正确。

http://kalvin.cn/locoy/2/4-1.htm
 楼主| 发表于 2007-2-4 21:01:01 | 显示全部楼层

...

http://tech.ddvip.com/2006-04/11444662804496.html

比如这上面的那个网址,它的头与尾分别是什么呢..,是下面那样吗?
头:    <div id="cntPL">[
尾:    ]</div>

它主要取的是 [<a href="] 与 [" target="_self">分页名称</a>]
里面的链接地址还是其它怎么样的呢...?
 楼主| 发表于 2007-2-4 21:31:47 | 显示全部楼层

.......................

头为:     #ff0000">1</font></a>]
尾为:     ]</div>

这其中的代码是怎么样分页,也就是大概的原理是怎么的呢...
[<a href="http://tech.ddvip.com/2006-04/11444662804496_2.html">2</a>]
[<a href="http://tech.ddvip.com/2006-04/11444662804496_3.html">3</a>]
[<a href="http://tech.ddvip.com/2006-04/11444662804496_4.html">4</a>]
[<a href="http://tech.ddvip.com/2006-04/11444662804496_2.html">下一页</a>]

难道它会自动读取 <a href=" 里面的链接,然后再用上面的头尾截取字段来截取,最后把内容放在一起,是这样吗?
 楼主| 发表于 2007-2-4 21:54:09 | 显示全部楼层

??

??
发表于 2007-2-5 11:45:06 | 显示全部楼层
原理不清楚 只知道是把分页范围包含进去就OK
 楼主| 发表于 2007-2-5 12:06:41 | 显示全部楼层

...........

那为什么我第一次写的头和尾为什么不行呢,也有包含进去啊..

头:    <div id="cntPL">[
尾:    ]</div>

为什么这个不行呢,也有啊...??
发表于 2007-2-5 12:56:37 | 显示全部楼层
我也不行..
http://tech.ddvip.com/2006-04/11444662804496_2.html 像这样的第二页可以 但是没看出两页有什么区别....
 楼主| 发表于 2007-2-5 13:05:54 | 显示全部楼层

..怪..是什么原因呢..?

 楼主| 发表于 2007-2-5 13:59:04 | 显示全部楼层

.................

请 孤魂 或其它版主,或管理员,帮我看看...
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 04:37

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表