52listen 发表于 2011-2-22 16:23:05

求解,站点先加载js脚本才打开正常页面。如何采集

采集的时候,遇到个问题,就是访问一个页面的时候,会先加载下面的代码,然后经过1001毫秒之后,才会返回正常页面,这种站点的话,应该如何采集呢??<html><head><title>&#x9875;&#x9762;&#x91cd;&#x8f7d;&#x5f00;&#x542f;</title></head><body bgcolor="#FFFFFF"><script language="JavaScript">function reload() {        document.location.reload();}setTimeout("reload()", 1001);</script><table cellpadding="0" cellspacing="0" border="0" width="700" align="center" height="85%"><tr align="center" valign="middle">    <td>    <table cellpadding="10" cellspacing="0" border="0" width="80%" align="center" style="font-family: Verdana, Tahoma; color: #666666; font-size: 11px">    <tr>      <td valign="middle" align="center" bgcolor="#EBEBEB">           <br /><br /> <b style="font-size: 16px">&#x9875;&#x9762;&#x91cd;&#x8f7d;&#x5f00;&#x542f;</b> <br /><br />&#x6b22;&#x8fce;&#x5149;&#x4e34;&#x672c;&#x7ad9;&#xff0c;&#x9875;&#x9762;&#x6b63;&#x5728;&#x91cd;&#x65b0;&#x8f7d;&#x5165;&#xff0c;&#x8bf7;&#x7a0d;&#x5019;&#x20;&#x2e;&#x2e;&#x2e;      <br /><br />      </td>    </tr>    </table>    </td></tr></table></body></html>

52listen 发表于 2011-2-22 16:23:50

<script language="JavaScript">function reload() {      document.location.reload();}setTimeout("reload()", 1001);</script>   主要是这段代码的影响吧。怎么弄呢。

lypying 发表于 2011-2-22 16:59:56

A5的黄网任务,这么这么多人普我的后尘啊 我没有采集到 这个网站很变态的 定时会换COOKIE 就算你这个解决了 后面还有要突破的 80块钱 不值得研究 放弃吧
页: [1]
查看完整版本: 求解,站点先加载js脚本才打开正常页面。如何采集