sndqt 发表于 2007-9-24 00:08:12

讨论怎么采集一个板块内无分页内容模板和有分页内容模板不同(已经解决)

刚刚采一个网站板块

假设01.htm 是无分页的

开头无重复HTM 为<body>结尾为</body>

02.htm 是有分页的

第一分页 HTM也是<Body>结尾是</Body1>

第二分页开头HTM也是<Body>结尾是</Body1>

最后一页开头HTM也是<Body>结尾才是</Body>

这样根2个模板差不多吧

请问能采不, 我是没采出来

能采的话仍个详细点的方法出来



已经解决方法按照6楼的


就是按照都有分页来采
这样就只有2个量了 呵呵

以前分开了有3个量就 不好弄了

[ 本帖最后由 sndqt 于 2007-9-24 23:41 编辑 ]

chinabobble 发表于 2007-9-24 00:38:42

这个应该不难吧,用 <body(*)>即可,至于分页,火车头会很体贴的帮你去检查是否有自动分页。不知这个能否帮到你。

sndqt 发表于 2007-9-24 00:44:02

原帖由 chinabobble 于 2007-9-24 00:38 发表 http://bbs.locoy.com/images/common/back.gif
这个应该不难吧,用 即可,至于分页,火车头会很体贴的帮你去检查是否有自动分页。不知这个能否帮到你。

</body1>是不同余</BODY>的 不是加个*就可以解决的

sharpboy 发表于 2007-9-24 01:16:23

你发个地址不就了事了.

sndqt 发表于 2007-9-24 09:11:32

原帖由 sharpboy 于 2007-9-24 01:16 发表 http://bbs.locoy.com/images/common/back.gif
你发个地址不就了事了.

发地址怕大家看了麻烦 呵呵 这样说可能比较简练点

我发出来

http://vista.yesky.com/yyjqwzlb/his/his_38.shtml这个是板块

http://os.yesky.com/windowsvista/220/3158720.shtml这个是无分页的

http://os.yesky.com/windowsvista/496/3105496.shtml这个是有分页的

[ 本帖最后由 sndqt 于 2007-9-24 09:13 编辑 ]

sharpboy 发表于 2007-9-24 12:24:32

你就按照有分页的做,没分页的他只采集第一页,
内容是一样的.只是一个会有分页一个没有. 分页采集是单独的.
如果采集不出来,很可能是你代码找的有问题.
我现在只用3.1
不知道你们都用什么版本.
测试过分页采集,应该是完美采集!去处了广告代码等.你自己看下吧.
很久没给人帮忙写规则了.

[ 本帖最后由 sharpboy 于 2007-9-24 13:00 编辑 ]

sndqt 发表于 2007-9-24 13:55:53

楼上的 你的规则是腾讯的 不是天极的

你就按照有分页的做,没分页的他只采集第一页   谢谢你这句了 呵呵

sharpboy 发表于 2007-9-24 14:03:53

没有任何错误.就是天极的.
我不知道你怎么能倒成腾讯的.我刚才还自己下载测试了下.
记得不要拿3.1的倒到3.2上用.至少我在3.2上作好后导入到3.1是不好用的.莫名其妙的会变成其他的网站地址.

xhei 发表于 2007-9-24 14:44:24

原帖由 sharpboy 于 2007-9-24 14:03 发表 http://bbs.locoy.com/images/common/back.gif
没有任何错误.就是天极的.
我不知道你怎么能倒成腾讯的.我刚才还自己下载测试了下.
记得不要拿3.1的倒到3.2上用.至少我在3.2上作好后导入到3.1是不好用的.莫名其妙的会变成其他的网站地址.

难怪我好的规则都变了

sharpboy 发表于 2007-9-24 17:41:12

这两个版本的CMS发布模块应该是通用的,但是规则好象是不通用的。所以导入导出必须是同版本.
页: [1] 2
查看完整版本: 讨论怎么采集一个板块内无分页内容模板和有分页内容模板不同(已经解决)