火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 6515|回复: 10

讨论怎么采集一个板块内无分页内容模板和有分页内容模板不同(已经解决)

[复制链接]
发表于 2007-9-24 00:08:12 | 显示全部楼层 |阅读模式
刚刚采一个网站板块

假设01.htm 是无分页的  

开头无重复HTM 为<body>  结尾为</body>

02.htm 是有分页的

第一分页 HTM也是<Body>  结尾是</Body1>

第二分页开头HTM也是<Body>结尾是</Body1>

最后一页开头HTM也是<Body>结尾才是</Body>

这样根2个模板差不多吧

请问能采不, 我是没采出来

能采的话仍个详细点的方法出来



已经解决  方法按照6楼的


就是按照都有分页来采
这样就只有2个量了 呵呵

以前分开了有3个量就 不好弄了

[ 本帖最后由 sndqt 于 2007-9-24 23:41 编辑 ]
发表于 2007-9-24 00:38:42 | 显示全部楼层
这个应该不难吧,用 <body(*)>即可,至于分页,火车头会很体贴的帮你去检查是否有自动分页。不知这个能否帮到你。
 楼主| 发表于 2007-9-24 00:44:02 | 显示全部楼层
原帖由 chinabobble 于 2007-9-24 00:38 发表
这个应该不难吧,用 即可,至于分页,火车头会很体贴的帮你去检查是否有自动分页。不知这个能否帮到你。


</body1>是不同余</BODY>的 不是加个*就可以解决的
发表于 2007-9-24 01:16:23 | 显示全部楼层
你发个地址不就了事了.
 楼主| 发表于 2007-9-24 09:11:32 | 显示全部楼层
原帖由 sharpboy 于 2007-9-24 01:16 发表
你发个地址不就了事了.


发地址怕大家看了麻烦 呵呵 这样说可能比较简练点

我发出来

http://vista.yesky.com/yyjqwzlb/his/his_38.shtml这个是板块

http://os.yesky.com/windowsvista/220/3158720.shtml这个是无分页的

http://os.yesky.com/windowsvista/496/3105496.shtml这个是有分页的

[ 本帖最后由 sndqt 于 2007-9-24 09:13 编辑 ]
发表于 2007-9-24 12:24:32 | 显示全部楼层
你就按照有分页的做,没分页的他只采集第一页,
内容是一样的.只是一个会有分页一个没有. 分页采集是单独的.
如果采集不出来,很可能是你代码找的有问题.
我现在只用3.1
不知道你们都用什么版本.
测试过分页采集,应该是完美采集!去处了广告代码等.你自己看下吧.
很久没给人帮忙写规则了.

[ 本帖最后由 sharpboy 于 2007-9-24 13:00 编辑 ]

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2007-9-24 13:55:53 | 显示全部楼层
楼上的 你的规则是腾讯的 不是天极的

你就按照有分页的做,没分页的他只采集第一页   谢谢你这句了 呵呵
发表于 2007-9-24 14:03:53 | 显示全部楼层
没有任何错误.就是天极的.
我不知道你怎么能倒成腾讯的.我刚才还自己下载测试了下.
记得不要拿3.1的倒到3.2上用.至少我在3.2上作好后导入到3.1是不好用的.莫名其妙的会变成其他的网站地址.
发表于 2007-9-24 14:44:24 | 显示全部楼层
原帖由 sharpboy 于 2007-9-24 14:03 发表
没有任何错误.就是天极的.
我不知道你怎么能倒成腾讯的.我刚才还自己下载测试了下.
记得不要拿3.1的倒到3.2上用.至少我在3.2上作好后导入到3.1是不好用的.莫名其妙的会变成其他的网站地址.


难怪我好的规则都变了
发表于 2007-9-24 17:41:12 | 显示全部楼层
这两个版本的CMS发布模块应该是通用的,但是规则好象是不通用的。所以导入导出必须是同版本.
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-24 20:32

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表