申请会员
登录
搜索
帮助
火车采集器|信息数据采集论坛
»
程序建议区
» 建议加一个内容分页处理机制
‹‹ 上一主题
|
下一主题 ››
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
[3.2版]
建议加一个内容分页处理机制
heidian
新手上路
UID
9746
帖子
45
活跃度
109 点
火车车厢
5 节
注册时间
2006-12-14
个人空间
发短消息
加为好友
当前离线
1楼
大
中
小
发表于 2008-3-17 21:39
只看该作者
建议加一个内容分页处理机制
现在的CMS系统生成内容分页其实都不是无规律的,比如我用风讯和IWMS都是采取以下模式:
当前page.html
当前page2.html
当前page3.html
当前page4.html
……
所以内容页里只要有一个这样按顺序递增数字的项目就基本能解决内容页问题,加上现有的处理机制就很完美了。
目前我用的SP5自动识别链接会出现页面数量不对,顺序不对的情况出现。这种问题很难察觉,但是对文章和书籍站点来说是大的一个问题。
UID
9746
帖子
45
精华
0
积分
109
活跃度
109 点
火车车厢
5 节
阅读权限
20
在线时间
490 小时
注册时间
2006-12-14
最后登录
2008-9-21
查看详细资料
TOP
沦陷今生
-_-!
管理员
@.@
UID
3977
帖子
1276
活跃度
2799 点
火车车厢
1279 节
注册时间
2006-7-10
个人空间
发短消息
加为好友
当前在线
2楼
大
中
小
发表于 2008-3-18 02:32
只看该作者
分页可使用自定义分页连接
火车头商业版购买咨询:
,火车头商业版售后服务:
提供高难度特殊采集,完美全站采集入库服务。
火车头采集器采集规则定制:[50/个,质量保证]
火车头采集器发布模块定制:[80/个,质量保证]
火车头采集器高级接口定制:[200/个,功能全面]
支付宝担保安全交易:
→点击进入安全交易←
QQ:11351936(人数已满),QQ:494839368 (技术咨询),QQ:948423048 (常年在线),QQ:839461016 (售前客服)
UID
3977
帖子
1276
精华
1
积分
2819
活跃度
2799 点
火车车厢
1279 节
阅读权限
200
来自
.........-_-!
在线时间
3280 小时
注册时间
2006-7-10
最后登录
2008-10-7
查看个人网站
查看详细资料
TOP
heidian
新手上路
UID
9746
帖子
45
活跃度
109 点
火车车厢
5 节
注册时间
2006-12-14
个人空间
发短消息
加为好友
当前离线
3楼
大
中
小
发表于 2008-3-18 08:07
只看该作者
我开始也是想也许自定义链接可以解决问题。但是我看内容页里的“自定义链接”只是把一种URL模式的参数提取出来,生成另一种URL,不能产生数字序列啊。
UID
9746
帖子
45
精华
0
积分
109
活跃度
109 点
火车车厢
5 节
阅读权限
20
在线时间
490 小时
注册时间
2006-12-14
最后登录
2008-9-21
查看详细资料
TOP
飛越無限
管理员
UID
55072
帖子
1313
活跃度
1681 点
火车车厢
70 节
注册时间
2007-7-9
个人空间
发短消息
加为好友
当前离线
4楼
大
中
小
发表于 2008-3-18 08:10
只看该作者
设置好开始代码同结束代码用系统自动识别就可以了。
火车头商业版购买与咨询、
火车高难度采集、全站采集入库服务
、采集规则定制、web在线发布、入库模块定制等业务
、大家多多支持呀!联系
QQ:86020004
┏┄┄┄┄站长交流中心┄┄┄┄┓
┇ 欢迎大家加入以下群,此群组主要为各位从事计算机爱好者服务欢迎各位高手加盟共同学习QQ群號:7830012 4671518┇
UID
55072
帖子
1313
精华
0
积分
1681
活跃度
1681 点
火车车厢
70 节
阅读权限
200
来自
中國
在线时间
2365 小时
注册时间
2007-7-9
最后登录
2008-10-7
查看详细资料
TOP
heidian
新手上路
UID
9746
帖子
45
活跃度
109 点
火车车厢
5 节
注册时间
2006-12-14
个人空间
发短消息
加为好友
当前离线
5楼
大
中
小
发表于 2008-3-18 09:02
只看该作者
我的这个老站的分页方式就不能这么处理,因为没有列全所有页,“下一页”标志也不是唯一的:
http://www.0791.net/html/2006-04/1271.htm
另外即使列全了,火车头的自动判断也很不稳定,比如这个页面,始终无法自动完整采集。可能是太大的原因,但是我用动易的.net版本测试竟然可以完整采集,这就有点说不过去了:
http://www.0791.net/html/2006-10/2235.htm
UID
9746
帖子
45
精华
0
积分
109
活跃度
109 点
火车车厢
5 节
阅读权限
20
在线时间
490 小时
注册时间
2006-12-14
最后登录
2008-9-21
查看详细资料
TOP
‹‹ 上一主题
|
下一主题 ››
论坛管理及公告
论坛记事、活动、培训区
火车采集器交流与讨论
程序发布
悬赏求助区
采集器讨论区
原1.X版本子讨论区
原2.0版本子讨论区
使用教程区
模块资源区
原1.2.0/1.2.1版本模块保留区
站点任务规则资源区
原1.X版本规则保留区
原2.0版本规则保留区
BUG报告
采集器资源求购区
程序建议区
各种CMS,论坛讨论区(与3.2发布同时开设)
Discuz! | & Supsite
PHPWind & VeryCMS
PHPCMS
DedeCMS
Powereasy动易
Foosun风讯
HBCMS
Dvbbs & DvPHP
WordPress 等Blog程序
Joomla等国外程序
ECMS帝国
新云程序
站长交流区
建站交流
网站赚钱
SEO技术交流
网站系统经验分享
火车域名注册
控制面板首页
编辑个人资料
积分交易
积分记录
公众用户组
个人空间管理
基本概况
流量统计
客户软件
发帖量记录
版块排行
主题排行
发帖排行
积分排行
交易排行
在线时间
管理团队
管理统计
Powered by
Discuz!
6.0.0
© 2001-2007
Comsenz Technology Ltd
Processed in 0.123716 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-7 17:14
皖ICP备06000549
清除 Cookies
-
联系我们
-
火车采集器官方站
-
静态归档
>
界面风格
----------
默认风格
喝彩奥运
深邃永恒
粉妆精灵
诗意田园
春意盎然