第一次见到这个的源码,xml+js的列表,求达人写规则(爱研究的进)

fourstone 发表于 2010-8-16 12:38:13

http://www.zynews.com/news/node_4263.htm

列表中：
<div class="content_01">
<xml id="ICSTitleListPreRepeat">
<data><!]></data>
</xml><xml id="ICSTitleListEndRepeat">
<data><!]></data>
</xml><div id="ICSTitleList"></div>
<xml id="titleList"><data></data></xml>
<xml id="worker"></xml>
<script language="javascript">
var pageSize=50;
var pageTotal=20;
var fileName="4263_";
var maxFileID=8;
</script>
<script src="scroll.js"></script>
<script language="javascript">
dataNode = titleList.selectSingleNode("data");
worker.async=false;
nextPage();
var currentip = "";
doTitleList();
</script>

这样的代码代替了常见的直接网址

aven 发表于 2010-8-16 12:40:35

用php等脚本语言辅助一下

fourstone 发表于 2010-8-16 12:43:14

用php等脚本语言辅助一下
aven 发表于 2010-8-16 12:40 http://bbs.locoy.com/images/common/back.gif

菜鸟了呵呵明白不了

wxl08 发表于 2010-8-16 14:45:28

用抓包工具分析列表存贮的真实位置 http://www.zynews.com/news/4263_8.xml

fourstone 发表于 2010-8-16 15:02:23

用抓包工具分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45 http://bbs.locoy.com/images/common/back.gif

那写规则的话直接就采集这个xml?还是每次都要先手动抓包再采集？

fourstone 发表于 2010-8-16 15:10:45

用抓包工具分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45 http://bbs.locoy.com/images/common/back.gif

另外能麻烦告知下，用了什么抓包工具和使用学习办法

用了好久火车头，还头一次听说这东西

wxl08 发表于 2010-8-16 15:48:58

火车采集器官网下载栏目有fiddler抓包工具下载

fourstone 发表于 2010-8-16 16:35:32

火车采集器官网下载栏目有fiddler抓包工具下载
wxl08 发表于 2010-8-16 15:48 http://bbs.locoy.com/images/common/back.gif

刚出去了下载了谢谢哦
还有就是每次采集前都要抓包吗？

yzimhao 发表于 2010-8-16 16:37:43

回复 8# fourstone

不用每次都抓你直接从这个地址作为列表页开始采集就行了

页: [1]

火车采集器软件交流官方论坛's Archiver

第一次见到这个的源码,xml+js的列表,求达人写规则(爱研究的进)