发新话题
打印

让火车头日后开发“所见即所得”式采集器,这个功能就天下无敌了。

让火车头日后开发“所见即所得”式采集器,这个功能就天下无敌了。

内容:如何下载http://haozi.yangzhi.com/news/200605/2006_05_16_7271.html文章

1/这页的内容存在于http://haozi.yangzhi.com/news/200605/c_2006_05_16_7271.html
2/这页使用了jsencode,首页得用script解密
3/此页限制了域名访问,如果直接访问,会访问不了,会访问指定网址,所以得去除这个限制
4/此页的内容用了加密,用js解密输出。所以,需要你能看到,但是,用现有的采集器,无法直接采集

script language="jscript.encode">
            #@~^ChwAAA==-mD~7F{J]yc^YvZ;.,ycY;l2G+YEl2,+Y;%~2F];%$o+];v++fuE0/RA];{+b/]!XA!TuElG&R]!f2,YERf/quEG+0vuEcAT+]!*AG];ow!3]!0FA%+{uE*3{+];*A1F];RZRA]!G+)ZuE*2w*Y;+%&AYERF2RTY&z uEXF*q ];*w+ uE9zb];Xy&+]!{2A+uElG z]!{vRv y];X8cFu;*G2cu;X&wF ];*o+y];swT2uE0TZ2];*AF]!1F!+uE+ZcZ]!1F;fYERs9)uEvFTAuE*R1/]!*yb+];{+%]!0fR,Y;l A9Y!so!AY!%oGAuE*W%AYElvosuE1WG]!X2Z!]!X{&R]!,{*TY!G{*yYERZ0$uEG);];vFTw];R%;G]!cATsuE*A Y;lFG8YEFZsOY;sw!A];,00+];%~)&yc&+l]EX3FvYER/RAY!G+bZuEl3!Z];*F&0Y!%sG)]!*ZZ*YEOGZ*YE0f+&YEW3!R];0Rc2Y;2!T!uTw]TR]22Iu&;Y WVYvZ;.1u c^YvZ;DOY+c^]+!5D1Yycs]+T;M,Y+WV]T$D1]y+uE*AZ;]EF&~+]!*{ z];{+%vu;*8G,u;AOcuEX2TTuEXG20]!G{TO]EooZ2YEl3OvY!%~2GuER$s+];%;%$Y!*Al+]!*FF1YE+AOcYEyfYEF2;];XycsY;F {Au;lF{O]!%%W2u;cAF0]!*++~]E+9bW]E+{T uEOb9bY;Fv0vu;*WZfY!G,/ouE*2W1uE*A!y]EwsZ3]!G+G~];Xy ,u;v+ fy{YEl2FvYEXqFvYER9Gl];{+%vY;Fv{su;RZ0~]!*2Z!u;*F&0]!soTA]E+s+]E++fuEF29AY;lF{,u;%;%$Y!c2q0uEZA)uEX8vF]EW2R*]!vXAy];{+%vu;vG&,u;X O,uEosT3uEX&~1]!*3{+]EXfG&YEl/lGY!G+GsuER/%~];GAcfY!vAO*]!GvRYElFF,YE$OcYE++&l *Y!*2{uEXZZ*uE*wFR]E+GZ$]!c3&y];X2,%u;G+%vu;XvGZuE ){uEf!ZT]!G{w]E0/RAYElqF,Y!v~,cuEl3!Z];*F&0Y!* 2+]!*2O{YER!wsYE{3W&YERfv8];XOF%Y;W2*Gu;lcZ]!ssZ2u;%~b$]!v+q2]EW32A]E+{GuEl TcY;+G1 u;cA!+Y!c2T1uE{vFouE0;%~]EFvR]!G3c2];~,cu;GyGAu;{!~AuEXc03uEX2ZT]!*{fR]E{RvYEWoO,Y!v;c!uElqG8];G;s1Y!*Z2f]!*&A9YEW2AGYEXoO*YElqsR];{~*vY;+%*bu;2!TZ]!*vwsu;*8%{]!*f92]EFfAy]EF$+2uEW2T Y;l&3%u;G+GoY!%Z0$uEvy9uEXF z&]2Al]!*3G+];ow!22Y&~]&z+YEl2FvYEXf;bYEl{ z];1Af&Y;Os1Au;+ZXG]!*G2 u;*2&0]!*q{O]E+$,W]E++f*uEW2+sY;l&9&u;G2A+Y!c20*uE{2WfuE~,W]ElFw0]!G%+];{+Gsu;%;%Au;osZ2uE*2+ouEXvwo]!*q1A]E*38%YEF1G&Y!*~vcuEOvZ];GyG$Y!c2zX]!G%8YEFbFcYE+W YEl+ ~];{l bY;Rs9Au;W21O]!*AOsu;%G&{]!G0+]EFGw]ER/0AuEFb0&Y;l&9bu;*Fs0Y!*v3+uEosZ3uE{AZG]ERs;X&y];*OF0Y!*2F]!GvRYEF%8vYE{)FcYEwo!A];{AZbY;W20Zu;lGo~]!%!~!u;vyF+]!*+1G]EW3%W]E++q&uElvosY;F&$ u;vF!$Y!Gv0uE{vFouE0;%~]E+*~+]!%+GZ];XF%,u;sw!2u;*2lfuEXZffuEvy9]!%$o+]E{FsYER/RAY!*F buE++F2];*+soY!GvR]!*FF1YE+AOcYEXfRcYElfsZ];X22%Y;+GTA2+uEXAG+]ElfA*]!*fs8];ow!2u;*8Gcu;*2w*uEX!f3uE{vR]!coX8]E{f~ YEW3lfY!v+ fuEW3Z; {]!*3{+]El+Fw]E++*suE+vfZY;F&$ u;*8s0Y!vG{uEosZ3uEX8GO]E+AO*]!*+cw];+vfu;,F*Zu;X22buEX2{9uE1v8]!soTA]E1{Z YE+/W!Y!vls%uEFfO];&Z!TY22O"Y&;]!wYT%u&AIY&/Yycs]+T;M,Y+WV]T$D1]y*^]Z;M,]y u;G+Go]!%/0~]EF%+]EF{suER {!Y;+A9,u;G+%Y!,!XXuE*sy+uEXFsR]ElvA+]!v G];+&Zu;vZ *u;XGw%uEXv3+u&3pjKHd2Yf;j]f3 p#ntJA]f;]!*FFcu;*~s$]!*31+]EF%+]E+ZuEO!q%Y;+A9,u;%yGTY!,!XXuE*sy+uEXFsR]ElvA+]!v G];1+, u;vZ *u;XGw%uEXv3+!];cw*cuE{Fs];0;%$]!{+GouER GZ]!v2ZYE+!+XuE*Fo%uE*+3+]!vF!$];18Zo]!XcZbY;RFsY!v$GOY!GRvuEcw*AYEF*+buEooZ2]! W ]!{!~]!GGoY!%/%~YEW2+0uEcoX8];*F*l];W22%]!vF*!uEXcZbY;Ws*8Y&Ap.h\J2u&;jY&3R5.KHd3]2Z;Y!&!TTuE1!zquE*Acz]E+ 8f]!c32A];{F!,u;cA! u;*2Z,uE1!T$uE1FWo]!**T;]E{RvYE+$G,Y!%yG!uEl+!W];GOA1Y!v!;{]!*F~{YEl,R!YE*3Z,YEwoFR]f3 I]f/u!o]Z0u&3"]2Z&uE2T!2];G+GoY!%ZR$]!c2W1YEO*wvYE{RvYEOT!~];18csYfAO]]2/u!ou!R]&AIufZuE{vFsY;RZ%~Y&Ap.h\J2u&;jY&3R5.KHd3]2Z;YycVYZ;.,u+WVY+!$D,u yYEOF*su&3}jnHd3]2Z]y*s]+!$D1]++u&3O5#ntS3Y2Z];{+Go]!0;%$u&Ap.hHd3]2Zi]22R}jnHd3]2ZEu+*VuvZ;.,Y+y]fsufsu&oYy ];08s]!~G1uEFvGw]!0ZRAY&Ap#KtS2ufZ`j]




访问刚才网址,第一次看到这个,这是第一次的加密,要有专门的解密程序才能看到内容
将心比心:你怎么得到这些消息。哪你怎么解的密。
dda:这网站很值钱么?这么多层防采集??


1/将标题和内容分开,内容在另一个文件中,这是第一步加大采集难度
2/内容所在的页面,采用了microsoft的加密方法,js是看到乱码的,这是第二步的加密
3/js加了限制,必须位于iframe中,这是第三步
4/js加了限制,用www.xxx.com的域名访问,否则会自动跳到指定首页,第四步
5/js加了限制,用js异或(好像是)方式解密内容,将内容输出,这是第五步




以上技术解说由DDA提拱
希望下一个火车头有这个可以解得功能。
                                                    祝火车头越做技术,功能越好,

TOP

用这个万能采集器,可以采集任何加密网页。

[ 本帖最后由 sticker 于 2006-9-28 15:01 编辑 ]
附件: 您所在的用户组无法下载或查看附件

TOP

附件: 您所在的用户组无法下载或查看附件

TOP

http://shuichan.yangzhi.com/news/200609/2006_09_27_25997.html

[ 本帖最后由 sticker 于 2006-9-28 15:41 编辑 ]
附件: 您所在的用户组无法下载或查看附件

TOP

看不出什么万能,就decode了一下吧?

TOP

不过是专门针对js加密的而已还什么万能,让你采集xml文件看你能 不能读出内容,还有采集迅雷的下载资源看能不能采集的到(不是论坛),当然不排除完善后可以。

TOP

  搞不好火车头也搞个。哈哈
盛世唐朝社区,精彩刚刚开始!

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.140184 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-14 12:43 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档