火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3608|回复: 8

第一次见到这个的源码,xml+js的列表,求达人写规则(爱研究的进)

[复制链接]
发表于 2010-8-16 12:38:13 | 显示全部楼层 |阅读模式
http://www.zynews.com/news/node_4263.htm

列表中:
<div class="content_01">
<xml id="ICSTitleListPreRepeat">
<data><![CDATA[<ul class="content_ul01"> ]]></data>
</xml><xml id="ICSTitleListEndRepeat">
<data><![CDATA[ </ul>]]></data>
</xml><div id="ICSTitleList"></div>
<xml id="titleList"><data></data></xml>
<xml id="worker"></xml>
<script language="javascript">
var pageSize=50;
var pageTotal=20;
var fileName="4263_";
var maxFileID=8;
</script>
<script src="scroll.js"></script>
<script language="javascript">
dataNode = titleList.selectSingleNode("data");
worker.async=false;
nextPage();
var currentip = "";
doTitleList();
</script>

这样的代码代替了常见的直接网址
发表于 2010-8-16 12:40:35 | 显示全部楼层
用php等脚本语言辅助一下
 楼主| 发表于 2010-8-16 12:43:14 | 显示全部楼层
用php等脚本语言辅助一下
aven 发表于 2010-8-16 12:40



    菜鸟了 呵呵 明白不了
发表于 2010-8-16 14:45:28 | 显示全部楼层
用抓包工具 分析列表存贮的真实位置 http://www.zynews.com/news/4263_8.xml
 楼主| 发表于 2010-8-16 15:02:23 | 显示全部楼层
用抓包工具 分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45



    那写规则的话 直接就采集这个xml?还是每次都要先手动抓包 再采集?
 楼主| 发表于 2010-8-16 15:10:45 | 显示全部楼层
用抓包工具 分析列表存贮的真实位置
wxl08 发表于 2010-8-16 14:45



    另外能麻烦告知下,用了什么抓包工具和使用学习办法

用了好久火车头,还头一次听说这东西
发表于 2010-8-16 15:48:58 | 显示全部楼层
火车采集器官网 下载栏目有fiddler抓包工具下载
 楼主| 发表于 2010-8-16 16:35:32 | 显示全部楼层
火车采集器官网 下载栏目有fiddler抓包工具下载
wxl08 发表于 2010-8-16 15:48



    刚出去了 下载了 谢谢哦
还有就是每次采集前都要抓包吗?
发表于 2010-8-16 16:37:43 | 显示全部楼层
回复 8# fourstone


    不用每次都抓 你直接从这个地址作为列表页开始采集就行了
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-13 03:55

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表