火车头对付这种网页是不是无能为力,不能采集?
http://www.hahawx.net/qita/46645/4528337.html 这样的页面其中,网页的文字部分主要内容是js产生的。
……
<script language="javascript">
outputTxt(67988, "4531288.txt");
</script>
……
这样如何采集 可以采集{:4_182:} 可以用多页面采集 用多页面采集很好采的呢。 需要使用插件从<script language="javascript">outputTxt(67988, "4531288.txt");</script>中提取67988, 4531288.txt 生成实际内容地址http://r.wl01.com:88/novel/68/988/4531288.txt
页:
[1]