第一次见到这个的源码,xml+js的列表,求达人写规则(爱研究的进)
http://www.zynews.com/news/node_4263.htm列表中:
<div class="content_01">
<xml id="ICSTitleListPreRepeat">
<data><!]></data>
</xml><xml id="ICSTitleListEndRepeat">
<data><!]></data>
</xml><div id="ICSTitleList"></div>
<xml id="titleList"><data></data></xml>
<xml id="worker"></xml>
<script language="javascript">
var pageSize=50;
var pageTotal=20;
var fileName="4263_";
var maxFileID=8;
</script>
<script src="scroll.js"></script>
<script language="javascript">
dataNode = titleList.selectSingleNode("data");
worker.async=false;
nextPage();
var currentip = "";
doTitleList();
</script>
这样的代码代替了常见的直接网址 用php等脚本语言辅助一下 用php等脚本语言辅助一下
aven 发表于 2010-8-16 12:40 http://bbs.locoy.com/images/common/back.gif
菜鸟了 呵呵 明白不了 用抓包工具 分析列表存贮的真实位置 http://www.zynews.com/news/4263_8.xml 用抓包工具 分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45 http://bbs.locoy.com/images/common/back.gif
那写规则的话 直接就采集这个xml?还是每次都要先手动抓包 再采集? 用抓包工具 分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45 http://bbs.locoy.com/images/common/back.gif
另外能麻烦告知下,用了什么抓包工具和使用学习办法
用了好久火车头,还头一次听说这东西 火车采集器官网 下载栏目有fiddler抓包工具下载 火车采集器官网 下载栏目有fiddler抓包工具下载
wxl08 发表于 2010-8-16 15:48 http://bbs.locoy.com/images/common/back.gif
刚出去了 下载了 谢谢哦
还有就是每次采集前都要抓包吗? 回复 8# fourstone
不用每次都抓 你直接从这个地址作为列表页开始采集就行了
页:
[1]