讨论怎么采集一个板块内无分页内容模板和有分页内容模板不同(已经解决)
刚刚采一个网站板块假设01.htm 是无分页的
开头无重复HTM 为<body>结尾为</body>
02.htm 是有分页的
第一分页 HTM也是<Body>结尾是</Body1>
第二分页开头HTM也是<Body>结尾是</Body1>
最后一页开头HTM也是<Body>结尾才是</Body>
这样根2个模板差不多吧
请问能采不, 我是没采出来
能采的话仍个详细点的方法出来
已经解决方法按照6楼的
就是按照都有分页来采
这样就只有2个量了 呵呵
以前分开了有3个量就 不好弄了
[ 本帖最后由 sndqt 于 2007-9-24 23:41 编辑 ] 这个应该不难吧,用 <body(*)>即可,至于分页,火车头会很体贴的帮你去检查是否有自动分页。不知这个能否帮到你。 原帖由 chinabobble 于 2007-9-24 00:38 发表 http://bbs.locoy.com/images/common/back.gif
这个应该不难吧,用 即可,至于分页,火车头会很体贴的帮你去检查是否有自动分页。不知这个能否帮到你。
</body1>是不同余</BODY>的 不是加个*就可以解决的 你发个地址不就了事了. 原帖由 sharpboy 于 2007-9-24 01:16 发表 http://bbs.locoy.com/images/common/back.gif
你发个地址不就了事了.
发地址怕大家看了麻烦 呵呵 这样说可能比较简练点
我发出来
http://vista.yesky.com/yyjqwzlb/his/his_38.shtml这个是板块
http://os.yesky.com/windowsvista/220/3158720.shtml这个是无分页的
http://os.yesky.com/windowsvista/496/3105496.shtml这个是有分页的
[ 本帖最后由 sndqt 于 2007-9-24 09:13 编辑 ] 你就按照有分页的做,没分页的他只采集第一页,
内容是一样的.只是一个会有分页一个没有. 分页采集是单独的.
如果采集不出来,很可能是你代码找的有问题.
我现在只用3.1
不知道你们都用什么版本.
测试过分页采集,应该是完美采集!去处了广告代码等.你自己看下吧.
很久没给人帮忙写规则了.
[ 本帖最后由 sharpboy 于 2007-9-24 13:00 编辑 ] 楼上的 你的规则是腾讯的 不是天极的
你就按照有分页的做,没分页的他只采集第一页 谢谢你这句了 呵呵 没有任何错误.就是天极的.
我不知道你怎么能倒成腾讯的.我刚才还自己下载测试了下.
记得不要拿3.1的倒到3.2上用.至少我在3.2上作好后导入到3.1是不好用的.莫名其妙的会变成其他的网站地址. 原帖由 sharpboy 于 2007-9-24 14:03 发表 http://bbs.locoy.com/images/common/back.gif
没有任何错误.就是天极的.
我不知道你怎么能倒成腾讯的.我刚才还自己下载测试了下.
记得不要拿3.1的倒到3.2上用.至少我在3.2上作好后导入到3.1是不好用的.莫名其妙的会变成其他的网站地址.
难怪我好的规则都变了 这两个版本的CMS发布模块应该是通用的,但是规则好象是不通用的。所以导入导出必须是同版本.
页:
[1]
2