第一次见到这个的源码,xml+js的列表,求达人写规则(爱研究的进)

fourstone · 发表于 2010-8-16 12:38:13

http://www.zynews.com/news/node_4263.htm

列表中：
<div class="content_01">
<xml id="ICSTitleListPreRepeat">
<data><![CDATA[<ul class="content_ul01"> ]]></data>
</xml><xml id="ICSTitleListEndRepeat">
<data><![CDATA[ </ul>]]></data>
</xml><div id="ICSTitleList"></div>
<xml id="titleList"><data></data></xml>
<xml id="worker"></xml>
<script language="javascript">
var pageSize=50;
var pageTotal=20;
var fileName="4263_";
var maxFileID=8;
</script>
<script src="scroll.js"></script>
<script language="javascript">
dataNode = titleList.selectSingleNode("data");
worker.async=false;
nextPage();
var currentip = "";
doTitleList();
</script>

这样的代码代替了常见的直接网址

aven · 发表于 2010-8-16 12:40:35

用php等脚本语言辅助一下

fourstone · 发表于 2010-8-16 12:43:14

用php等脚本语言辅助一下
aven 发表于 2010-8-16 12:40

菜鸟了呵呵明白不了

wxl08 · 发表于 2010-8-16 14:45:28

用抓包工具分析列表存贮的真实位置 http://www.zynews.com/news/4263_8.xml

fourstone · 发表于 2010-8-16 15:02:23

用抓包工具分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45

那写规则的话直接就采集这个xml?还是每次都要先手动抓包再采集？

fourstone · 发表于 2010-8-16 15:10:45

用抓包工具分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45

另外能麻烦告知下，用了什么抓包工具和使用学习办法

用了好久火车头，还头一次听说这东西

wxl08 · 发表于 2010-8-16 15:48:58

火车采集器官网下载栏目有fiddler抓包工具下载

fourstone · 发表于 2010-8-16 16:35:32

火车采集器官网下载栏目有fiddler抓包工具下载
wxl08 发表于 2010-8-16 15:48

刚出去了下载了谢谢哦
还有就是每次采集前都要抓包吗？

yzimhao · 发表于 2010-8-16 16:37:43

回复 8# fourstone

不用每次都抓你直接从这个地址作为列表页开始采集就行了

帐号		自动登录	找回密码
密码			加入会员