申请会员
登录
搜索
帮助
火车采集器|信息数据采集论坛
»
站点任务规则资源区
» 津报网娱乐网址采集遇到的问题:javascript/xml类的如何设置规则?
‹‹ 上一主题
|
下一主题 ››
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
津报网娱乐网址采集遇到的问题:javascript/xml类的如何设置规则?
dangshi
新手上路
UID
3966
帖子
55
活跃度
65 点
火车车厢
5 节
注册时间
2006-7-9
个人空间
发短消息
加为好友
当前离线
1楼
大
中
小
发表于 2006-12-30 14:40
只看该作者
津报网娱乐网址采集遇到的问题:javascript/xml类的如何设置规则?
津报网-娱乐-娱乐要闻:
http://ent.tianjindaily.com.cn/node/node_4306.htm
这一页的娱乐要闻网址如何采?网址代码如下,有javascript/xml .我用的是3.01版
<table width="500" border="0" align="center" cellpadding="0" cellspacing="0" bgcolor="#D0D1D4">
<tr>
<td valign="top" bgcolor="#FFFFFF" class="style6"><p>
<xml id="ICSTitleListPreRepeat">
<data><![CDATA[]]></data>
</xml><xml id="ICSTitleListEndRepeat">
<data><![CDATA[ ]]></data>
</xml><div id="ICSTitleList"></div>
<xml id="titleList"><data></data></xml>
<xml id="worker"></xml>
<script language="javascript">
var pageSize=50;
var pageTotal=500;
var fileName="4306_";
var maxFileID=8;
</script>
<script src="scroll.js"></script>
<script language="javascript">
dataNode = titleList.selectSingleNode("data");
worker.async=false;
nextPage();
var currentip = "";
doTitleList();
</script>
<table>
日月之行,若出其中;星汉灿烂,若出其里
UID
3966
帖子
55
精华
0
积分
65
活跃度
65 点
火车车厢
5 节
阅读权限
20
在线时间
240 小时
注册时间
2006-7-9
最后登录
2007-4-19
查看详细资料
TOP
xyyfx
管理员
UID
6635
帖子
2113
活跃度
3115 点
火车车厢
88 节
注册时间
2006-10-4
个人空间
发短消息
加为好友
当前离线
2楼
大
中
小
发表于 2006-12-30 16:49
只看该作者
好像是JSP网页写的,是XML,目前采不了!
火车采集器VIP,论坛大挪移VIP,模块以及规则定制,免费模块规则和采集录像教程请进
UID
6635
帖子
2113
精华
0
积分
3771
活跃度
3115 点
火车车厢
88 节
阅读权限
200
在线时间
1470 小时
注册时间
2006-10-4
最后登录
2008-9-4
查看个人网站
查看详细资料
TOP
xyyfx
管理员
UID
6635
帖子
2113
活跃度
3115 点
火车车厢
88 节
注册时间
2006-10-4
个人空间
发短消息
加为好友
当前离线
3楼
大
中
小
发表于 2006-12-30 17:22
只看该作者
其实,你可以用其他的方法先采集所有的链接,然后再用火车采!转个弯而已!采集xml链接的很多的!
火车采集器VIP,论坛大挪移VIP,模块以及规则定制,免费模块规则和采集录像教程请进
UID
6635
帖子
2113
精华
0
积分
3771
活跃度
3115 点
火车车厢
88 节
阅读权限
200
在线时间
1470 小时
注册时间
2006-10-4
最后登录
2008-9-4
查看个人网站
查看详细资料
TOP
dangshi
新手上路
UID
3966
帖子
55
活跃度
65 点
火车车厢
5 节
注册时间
2006-7-9
个人空间
发短消息
加为好友
当前离线
4楼
大
中
小
发表于 2007-1-1 10:32
只看该作者
自制一个网页来采集
谢谢了。在下是初学者,刚练习采集就遇到了这样一个问题。经嘉宾先生指点,找到了方法:复制所采集网页上的网址,粘贴在一个新的html文件上,把这个文件上传到网站上,再采集这个自制的网页,就行了。不知各位有什么好方法?
[
本帖最后由 dangshi 于 2007-1-1 12:55 编辑
]
日月之行,若出其中;星汉灿烂,若出其里
UID
3966
帖子
55
精华
0
积分
65
活跃度
65 点
火车车厢
5 节
阅读权限
20
在线时间
240 小时
注册时间
2006-7-9
最后登录
2007-4-19
查看详细资料
TOP
‹‹ 上一主题
|
下一主题 ››
论坛管理及公告
论坛记事、活动、培训区
火车采集器交流与讨论
程序发布
悬赏求助区
采集器讨论区
原1.X版本子讨论区
原2.0版本子讨论区
使用教程区
模块资源区
原1.2.0/1.2.1版本模块保留区
站点任务规则资源区
原1.X版本规则保留区
原2.0版本规则保留区
BUG报告
采集器资源求购区
程序建议区
各种CMS,论坛讨论区(与3.2发布同时开设)
Discuz! | & Supsite
PHPWind & VeryCMS
PHPCMS
DedeCMS
Powereasy动易
Foosun风讯
HBCMS
Dvbbs & DvPHP
WordPress 等Blog程序
Joomla等国外程序
ECMS帝国
新云程序
站长交流区
建站交流
网站赚钱
SEO技术交流
网站系统经验分享
火车域名注册
控制面板首页
编辑个人资料
积分交易
积分记录
公众用户组
个人空间管理
基本概况
流量统计
客户软件
发帖量记录
版块排行
主题排行
发帖排行
积分排行
交易排行
在线时间
管理团队
管理统计
Powered by
Discuz!
6.0.0
© 2001-2007
Comsenz Technology Ltd
Processed in 0.190001 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 05:39
皖ICP备06000549
清除 Cookies
-
联系我们
-
火车采集器官方站
-
静态归档
>
界面风格
----------
默认风格
喝彩奥运
深邃永恒
粉妆精灵
诗意田园
春意盎然