火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 9812|回复: 20

无法刷新列表的各种 格式不符 的情况收集整理帖 【真心实意帮助新人】

[复制链接]
发表于 2008-12-28 22:25:55 | 显示全部楼层 |阅读模式
本帖最后由 xiongyujie37 于 2008-12-28 22:50 编辑

【说明】:这里指的格式不符情况是在论坛上发布出来的模块,别人都用的正常,偏偏自己不正常。这样说明出错的自己,而不是别人的情况下,如果自己写的模块,自己都无法成功,那么也可以参考以下各种情况。

【引言】:格式不符,官方没有定义具体含义,大致意思就是火车头为了方便各位朋友分类发布文章,而应用了一个重要的概念“刷新列表”,也就是大家使用的各种CMS以及博客的分类。火车头模拟了IE浏览器来识别您的分类,以快捷的方式发送到指定目录下。

     从实际意义上讲,这个“刷新列表”提高分类发布的先进手段,也是一个可有可无的设置。所以,本文试图从开场白部分,舒缓屡次被“格式不符”搞的心神不宁,甚至要砸电脑的朋友。即便是你无法刷新列表,N次的“格式不符”,也不必生气着急,我们还有变通的手段!

【格式不符可能情况罗列】:

1、你的CMS风格与别人不一样。

      观察一下模块的作者,把刷新列表的位置写在哪里。如图,在这个地方观察




     如果模块作者把刷新列表写在 Index.php之类,也就是把刷新列表写在首页是有很大的可能,会造成因为风格模板的不同产生无法刷新列表的情况。合理与科学的写法是,写在搜索页面或者发布页面,最好是写在发布页面,这样也可以测试是否登录上。



2、你是否模拟了蜘蛛

    有的网站防采集,比如雅虎部分频道(采集600页后自动封IP),于是很多朋友模拟了蜘蛛的采集,但是有这种情况的朋友在发布的时候是要修正过来的哦!

     设置的地方如图:发布的时候改成 模拟用户浏览器



3、你是否使用了代理


     火车头会自动套用IE的代理设置,根据我的观察,在使用工具软件代理的时候,很多时候会被屏蔽掉。如果采集的时候必须翻墙,那么发布的时候最好不要使用国外代理。

     当然有没有变通的方法呢。有,我的实验是使用IE代理会造成登录不上,那么使用VPN 绝对是可行的,从根本上来解决问题。IE不要设置任何代理,用VPN来解决这个问题。有个瑞典的VPN,免费一个月的,速度还可以,我这里可以达到160K的速度,搜索一下 瑞典 VPN ,他就会出来的。


4、COOKIES值的错误

    火车头使用COOKIES来模拟IE的登录,对于那些模块根本没有写登录项,光指望cookies模式来说,获取不到正确的COOKIES是非常致命的。

    识别正确与错误的判断手段是,刷新列表的时候选择 返回代码 。  如图:




       如果返回的代码是,请登录等等,那说明自动获取的cookies值是错的。引起这样的问题,原因非常之多,比如你的IE被插件的干扰,比如你CMS的验证机制,特别是你没有掌控权的CMS,比如各大博客BSP。

        最好的办法就是,你清空一下cookies,重启电脑之后获取,再不行,就到微软官方下载个IE6 或者 7,重装下IE,尽量避免安装IE插件。特别是各大公司的工具栏,比如恶心的百度搜霸,QQ工具栏等,他们在帮助你的同时,还偷偷的收集你的资料和用户习惯,以及各种不知道的暗箱操作。


5、你没有选择正确的编码

      其实,对于模块来说,基本上模块里面没有汉字,那么各种编码90%以上都是可以通用的,但是你在对自己本站的选择的时候,一定要选择正确的编码。

       编码的具体设置如下图:





      如果你不是你的网站,你不知道是什么编码,那么随便打开那个网站的一个页面,点击右键,在编码选项中,查看一下哪个地方打了勾勾。
      如果你仍然觉得上面那段话难以理解,索性你把每个编码都试一遍。

6、检查你的系统文件 UserAgent值是否与浏览器一致。

     打开你火车头的根目录,找到system文件夹,然后用记事本打开 config.ini

     找到 UserAgent=  这段

     比如 我这里是     UserAgent=Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) ; .NET CLR 2.0.50727; .NET CLR 1.1.4322)

     然后打开 火车头的内置浏览器  



      对着这个那对情侣点一下哈,



    看看这里的浏览器 UserAgent值与系统文件夹 config.ini里面的是否一致,如果不一致,那就把浏览器得到值替换掉 系统文件夹里面的。


7、你的CMS地址填写错误

    比如你填写  http://www.locoy.com/

    但是可能正确的写法是      http://www.locoy.com

    以及各种我们不清楚的地方,关于每个发布模块的CMS地址,每个作者在模块说明里面或者发布模块的帖子都会说明的。如果哪个地方都找不到,那你就要联系作者问问正确的CMS地址是什么,这个非常重要。如果你填写的CMS是错误的,那么也不可能发布成功的。




【无药可救的情况下】


      如果你试过所有的办法都没有规避格式不符的情况,那么索性不要理他,直接填入固定值。

      基本上所有的CMS都会为你的每一个分类创建唯一的数字ID,这个数字ID就是我们想要的分类ID。

      简便的方法是,打开有分类的页面,把鼠标移动到你创建的分类那里,注意浏览器的左下角,会显示一长串的链接,那串链接中的一个ID就是你需要的ID。这个只能说根据经验去判断了,无法直接说哪个位置就是分类ID。

      稍微复杂点的方法是,打开有分类的页面,点击鼠标右键查看源代码,使用搜索的方法,搜索含有分类名称的字段那里,观察旁边的数字ID,一般都写在一个括号里面,那个数字ID就是想要的,这个也无法直接说明位置,靠经验摸索一下。

      如果你找到了正确的分类数字ID,不妨不要刷新列表,直接填入固定ID。有两种方法

     第一种,直接在配置页面写入固定分类ID  

      第二种是,在发布页面写入固定分类ID




      如果你仍然解决不了你的问题,请到本帖来写明情况,我们会热情的帮你参考的。

       没有不好的学生,只有不好的导师对不对哈~不过我们最怕的就是上来就骂无法刷新列表的朋友,也不说明情况,你说我们怎么给你参考呢?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

3

查看全部评分

 楼主| 发表于 2008-12-28 22:33:29 | 显示全部楼层
哪位超版  帮忙编辑一下

我无法把图  插到指定位置了。。。。


不晓得怎么回事,一点到图那里,就总是出缩略图,不给点击插入。。。


怒。。。
 楼主| 发表于 2008-12-28 22:37:11 | 显示全部楼层
搞定 ,用 OPREA 搞定的

不晓得这是我IE的问题 还是 DZ7的BUG
发表于 2009-1-2 16:11:13 | 显示全部楼层
这么好的贴,即然没人顶
发表于 2009-1-2 16:27:27 | 显示全部楼层
路过帮顶。呵
发表于 2009-1-2 22:35:47 | 显示全部楼层
顶起来,支持小熊
发表于 2009-1-2 22:41:49 | 显示全部楼层
发表于 2009-1-2 22:45:17 | 显示全部楼层
顶上去。
发表于 2009-1-5 03:27:30 | 显示全部楼层
谢谢分享
发表于 2009-1-5 04:40:48 | 显示全部楼层
学到了,多谢楼主。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-24 14:52

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表