caifanzi 发表于 2011-10-13 22:25:06

火车头对付这种网页是不是无能为力,不能采集?

http://www.hahawx.net/qita/46645/4528337.html 这样的页面
其中,网页的文字部分主要内容是js产生的。
……
<script language="javascript">
         outputTxt(67988, "4531288.txt");
</script>
……
这样如何采集

lypying 发表于 2011-10-14 10:38:45

可以采集{:4_182:}

meichao 发表于 2011-10-14 11:52:15

可以用多页面采集

303718 发表于 2011-10-15 08:07:30

用多页面采集很好采的呢。

wxl08 发表于 2011-10-15 09:02:06

需要使用插件从<script language="javascript">outputTxt(67988, "4531288.txt");</script>中提取67988, 4531288.txt 生成实际内容地址http://r.wl01.com:88/novel/68/988/4531288.txt
页: [1]
查看完整版本: 火车头对付这种网页是不是无能为力,不能采集?