dlhe 发表于 2008-11-20 11:05:58

动态内容采集有待改进?

在采集时遇到这样一个问题,文章页用<script language='javascript' src=abc.asp?**********'></script>引用了一个页面内容,我通过自定义连接获取地址后,查看源代码就这么一个功能函数,产看源代码可以看到代码如下,但是想采内容却是一片空白,代码查看其与采集时使用的是不是有区别呀
function closehotms(){document.getElementById('hetmsDiv').style.display='none';} document.getElementById("hotmsDiv").innerHTML ="<div id='NewsID'class='side_block'><div class='side_title'><div class='side_title_1'>内容</div>;

说明:通过火车头自带的源代码查看工具可以查看到function closehotms(){document.getElementById('hetmsDiv').style.display='none';} document.getElementById("hotmsDiv").innerHTML ="<div id='NewsID'class='side_block'><div class='side_title'><div class='side_title_1'>内容</div>;

使用自己的IE浏览器则只能看到<html></html>

对于这样的内容是不是,火车头是不是可以进行进行改进呀

rq204 发表于 2008-11-20 11:16:51

这里是用脚本处理了一下内容,请你研究一下脚本是如何工作的.这样的采集应是没有问题.

懷念過去↑文 发表于 2008-11-20 11:18:10

我觉得这是正常的 基本按照火车原代码查看 为准!如果按照IE则采集不到

lovebaidu 发表于 2008-11-20 11:36:32

ks呵呵。我用火狐得到的代码还行。

dlhe 发表于 2008-11-20 13:22:29

原帖由 rq204 于 2008-11-20 11:16 发表 http://bbs.locoy.com/images/common/back.gif
这里是用脚本处理了一下内容,请你研究一下脚本是如何工作的.这样的采集应是没有问题.

弄了老半天了,采不到。定义的直接采function函数都不行
采集规则
开始字符串function
结束字符串}

最奇怪的是,采集结果是空,连定义的标签都不显示了。太奇怪俄,大侠们可以试一试

采集的目标地址
http://shequ3.tool.hexun.com/rest/blogtrack.aspx?userid=1&articleid=25948627&topcount=8
页: [1]
查看完整版本: 动态内容采集有待改进?