fujianqin 发表于 2018-1-23 14:42:06

请教,火车能采集js生成的html嘛?

https://www.733.so/mh/11464/106708.html?page=1
这个网站上的图片上通过js 生成的的。源码中只有一个加载图片

<div id="detail">
       <div class="viewimages" id="viewimages"><div ondblclick=nextPage() id="show_p">
          <img src="/skin/2014mh/pic_loading.gif" alt="loading..." /></div>
      </div>
      <div class="viewtext" id="viewtext" style="display:none;"></div>
</div>      
</div>
每次采集都只能采集到加载图片。求大神解救。

leweizxl 发表于 2018-1-23 15:02:11

var photosr = new Array();
packed="ZXZhbChmdW5jdGlvbihwLGEsYyxrLGUsZCl7ZT1mdW5jdGlvbihjKXtyZXR1cm4gYy50b1N0cmluZygzNil9O2lmKCEnJy5yZXBsYWNlKC9eLyxTdHJpbmcpKXt3aGlsZShjLS0pe2RbYy50b1N0cmluZyhhKV09a1tjXXx8Yy50b1N0cmluZyhhKX1rPVtmdW5jdGlvbihlKXtyZXR1cm4gZFtlXX1dO2U9ZnVuY3Rpb24oKXtyZXR1cm4nXFx3Kyd9O2M9MX07d2hpbGUoYy0tKXtpZihrW2NdKXtwPXAucmVwbGFjZShuZXcgUmVnRXhwKCdcXGInK2UoYykrJ1xcYicsJ2cnKSxrW2NdKX19cmV0dXJuIHB9KCc2WzFdPSI4LzAvNy85LzAvZC41Ijs2WzJdPSI4LzAvNy85LzAvYS41Ijs2WzNdPSI4LzAvNy85LzAvYi41Ijs2WzRdPSI4LzAvNy85LzAvYy41IjsnLDE0LDE0LCcwOXx8fHx8anBnfHBob3Rvc3J8MDJ8MjAxM3wyMnw0Nzc5fDQ3ODB8NDc4MXw0Nzc4Jy5zcGxpdCgnfCcpLDAse30pKQo=";eval(eval(base64decode(packed).slice(4)));
将这些数据解码下就能获得相关参数base64的码

fujianqin 发表于 2018-1-23 15:10:00

leweizxl 发表于 2018-1-23 15:02
var photosr = new Array();
packed="ZXZhbChmdW5jdGlvbihwLGEsYyxrLGUsZCl7ZT1mdW5jdGlvbihjKXtyZXR1cm4gY ...

解码出来,具体应该怎做呢,请详解,谢谢大神了。

fujianqin 发表于 2018-1-23 15:17:09

或者火车能不能等待ajax请求完了再去采集页面。

leweizxl 发表于 2018-1-23 16:28:23

fujianqin 发表于 2018-1-23 15:10
解码出来,具体应该怎做呢,请详解,谢谢大神了。

http://img.hi328.com/img.php?file=2013/09/02/22/09/4779.jpg&mode=pc&id=/mh/11464/106708.html&hash=9abcac77aee53df7e227501088123fba
可以用fiddler抓包下图片链接

fujianqin 发表于 2018-1-23 16:31:12

leweizxl 发表于 2018-1-23 16:28
http://img.hi328.com/img.php?file=2013/09/02/22/09/4779.jpg&mode=pc&id=/mh/11464/106708.html&hash= ...

抓能抓到,火车头能不能自动去抓取并下载下来么。

leweizxl 发表于 2018-1-23 16:50:24

fujianqin 发表于 2018-1-23 16:31
抓能抓到,火车头能不能自动去抓取并下载下来么。

你要设置获取到真实的链接先

fujianqin 发表于 2018-1-23 16:59:43

leweizxl 发表于 2018-1-23 16:50
你要设置获取到真实的链接先

就以抓包出来的地址测试。没有办法下载呢。

leweizxl 发表于 2018-1-23 17:39:56

fujianqin 发表于 2018-1-23 16:59
就以抓包出来的地址测试。没有办法下载呢。

看过了下载是正常的
想问详细问题可以联系企业QQ800019423在线咨询
页: [1]
查看完整版本: 请教,火车能采集js生成的html嘛?