rune1578 发表于 2009-2-26 01:15:13

求助高手,发现有方法能克制被采集。

各位火车头的高手们,大家好,本人使用火车头不久,技术很菜,锻炼先从采集论坛开始,针对采集网站写了一个规则,前几天都能正常采集,但是今天采集却发现了蹊跷,采集到的内容多数为空白,后来在火车头的编辑任务里的测试采集页面的对话框中测试,按测试,发现时而采集得到,时而又采集为空,百思不得其解。发现采集到的内容内多出一段代码。


<script>if(location.href.indexOf('nant'+'aihu')==-1){alert('欢迎访问论坛!');window.location='http://bbs.nantaihu.com';};</script>


请高手指导,此段代码是否是造成我采集不到内容的元凶?

normandgh 发表于 2009-2-26 01:54:56

我也遇到了这样的问题请高手指点

rune1578 发表于 2009-2-26 15:24:52

歇菜了~已经完全克制了火车头了~~~

沦陷今生 发表于 2009-2-26 16:03:17

建议贴出 采集目标页面的地址,方便大家分析

rune1578 发表于 2009-2-27 20:37:55

代码里有地址,整站都不能采集,http://bbs.nantaihu.com
其中水区需要账户,其他板块都不需要就能直接进入,真是道高一尺,魔高一尺,我还就不信了,伟大的火车头还治不了他了。。。

rune1578 发表于 2009-2-27 20:38:59

加入我写的采集规则

rune1578 发表于 2009-2-27 21:52:19

ok问题解决了
这两天看来论坛是发现我的动作了
所以更改了域名的伪静态
还把原来的内容代码也更改了
现在我重新修改了规则
又可以自由自在的采集咯

rune1578 发表于 2009-2-27 21:53:52

附上新的规则
主要是把标题
<span class="forumViewTitle"(*)><b>
和内容的开始部分修改了一下
<span class="(*)Content(*)"(*)>
真是够变态的

rune1578 发表于 2009-2-28 14:21:38

又遇上麻烦了~~求助啊~~
现在采集是能采集的到,但是采集到的内容都是经过JS加密的,有没有办法能够JS解密啊?
页: [1]
查看完整版本: 求助高手,发现有方法能克制被采集。