火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4936|回复: 12

国外防止采集的新技术

[复制链接]
发表于 2010-4-12 03:44:51 | 显示全部楼层 |阅读模式
很多国外网站的图片都是这种形式<img id=11>,而在下面有个js,就是id11=111.jpg,大概这样的例子,请问这样的该如何采集,一个页面可能有n个id=xx这样的
发表于 2010-4-12 08:18:20 | 显示全部楼层
通过js往属性里面赋值。您直接采集并解析这个js得到图片的地址不就行了?
 楼主| 发表于 2010-4-12 10:02:41 | 显示全部楼层
这个中间涉及一个替换,就是不知道怎么写,直接采js,图片在文章中的位置就对不上了,这是关键!
发表于 2010-4-12 11:12:47 | 显示全部楼层
找出ID和图片文件名对应规律,替换就可以了吧
发表于 2010-4-12 13:56:42 | 显示全部楼层
这不是防采集吧,呵呵。防采直接封你ip N小时
 楼主| 发表于 2010-4-12 14:37:43 | 显示全部楼层
不会封IP的,关键是在一个页面中怎么替换呢?
 楼主| 发表于 2010-4-12 14:48:09 | 显示全部楼层
大概就是这个样子的:
<p><img id='ll_4' /></p>
中间有文字内容
<p><img id='ll_5' /></p>
<script language='JavaScript'>
  var imgGroup = new YAHOO.util.ImageLoader.group(window, 'scroll');
  imgGroup.foldConditional = true;
  imgGroup.addTrigger(window, 'resize');
  imgGroup.registerSrcImage('ll_4', 'http://ezinearicles.com/ap_F23_20100106022945883.jpg?TT0hswLB03w8zAIp');
  imgGroup.registerSrcImage('ll_5', 'http://ezinearicles.com/ap_F23_20100106022945883.jpg?TT0hswLB0358zAIp');
发表于 2010-4-12 15:55:54 | 显示全部楼层
很实在的例子。。同求!
发表于 2010-4-13 08:55:33 | 显示全部楼层
有人解决了吗?写个详细点的方法出来看下!!!真的不懂怎么采集这个网..
发表于 2010-4-16 15:19:56 | 显示全部楼层
第一种方法:新建一个标签,把JS 也一起采集放在页面上;
第二种方法:采集页面上的图片ID,然后在数据库中用第三方程序写转换程序(很常用,一般对内容的处理要求更人性化)
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-19 08:20

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表