fourstone 发表于 2010-8-16 12:38:13

第一次见到这个的源码,xml+js的列表,求达人写规则(爱研究的进)

http://www.zynews.com/news/node_4263.htm

列表中:
<div class="content_01">
<xml id="ICSTitleListPreRepeat">
<data><!]></data>
</xml><xml id="ICSTitleListEndRepeat">
<data><!]></data>
</xml><div id="ICSTitleList"></div>
<xml id="titleList"><data></data></xml>
<xml id="worker"></xml>
<script language="javascript">
var pageSize=50;
var pageTotal=20;
var fileName="4263_";
var maxFileID=8;
</script>
<script src="scroll.js"></script>
<script language="javascript">
dataNode = titleList.selectSingleNode("data");
worker.async=false;
nextPage();
var currentip = "";
doTitleList();
</script>

这样的代码代替了常见的直接网址

aven 发表于 2010-8-16 12:40:35

用php等脚本语言辅助一下

fourstone 发表于 2010-8-16 12:43:14

用php等脚本语言辅助一下
aven 发表于 2010-8-16 12:40 http://bbs.locoy.com/images/common/back.gif


    菜鸟了 呵呵 明白不了

wxl08 发表于 2010-8-16 14:45:28

用抓包工具 分析列表存贮的真实位置 http://www.zynews.com/news/4263_8.xml

fourstone 发表于 2010-8-16 15:02:23

用抓包工具 分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45 http://bbs.locoy.com/images/common/back.gif


    那写规则的话 直接就采集这个xml?还是每次都要先手动抓包 再采集?

fourstone 发表于 2010-8-16 15:10:45

用抓包工具 分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45 http://bbs.locoy.com/images/common/back.gif


    另外能麻烦告知下,用了什么抓包工具和使用学习办法

用了好久火车头,还头一次听说这东西

wxl08 发表于 2010-8-16 15:48:58

火车采集器官网 下载栏目有fiddler抓包工具下载

fourstone 发表于 2010-8-16 16:35:32

火车采集器官网 下载栏目有fiddler抓包工具下载
wxl08 发表于 2010-8-16 15:48 http://bbs.locoy.com/images/common/back.gif


    刚出去了 下载了 谢谢哦
还有就是每次采集前都要抓包吗?

yzimhao 发表于 2010-8-16 16:37:43

回复 8# fourstone


    不用每次都抓 你直接从这个地址作为列表页开始采集就行了
页: [1]
查看完整版本: 第一次见到这个的源码,xml+js的列表,求达人写规则(爱研究的进)