火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4640|回复: 9

[求助]求不在同一页面的采集规则

[复制链接]
发表于 2008-12-29 10:09:09 | 显示全部楼层 |阅读模式
3火车车厢
我要采集此站
www.bbb119.com
他们的电影简介、图片等相关介绍在第一页
http://www.bbb119.com/Action%20movie/a943a0e0d738377f.html

点开播放后,只是出现的一个静态页面,并不是数据的有效地址
http://www.bbb119.com/Player.asp?3954,1,6,1.html
在继续查看源文件,发现他是调用此页的
http://www.bbb119.com/Play.asp?3954,1,6,1

进入此页后,查看源代码,才能找到他的数据地址
http://61.191.63.83:8032/222713727/0925F51DB2023FB4EA302A11735A0B6C3D80A717/叶问 抢先版.rmvb
现在请问:
如何将他第一页的电影简介、图片等相关介绍,与他最后一页的数据地址同时采集呢?
就是红字标出的那些!!!!求采集规则

再次感谢各位火车达人的帮助

发表于 2008-12-29 10:28:50 | 显示全部楼层
不会,帮楼主顶起来。
发表于 2008-12-29 12:46:13 | 显示全部楼层
用多页采集可以实现,论坛里有教程,可以参考一下这个教程http://bbs.locoy.com/viewthread. ... e%3D1&frombbs=1
 楼主| 发表于 2008-12-29 13:36:13 | 显示全部楼层
晕倒,楼上的还要车箱,我全在这帖了。要不你帮我一下,我三节全给你
 楼主| 发表于 2008-12-29 16:01:56 | 显示全部楼层

我弄的规则,应该还差最后一步

本帖最后由 gunjack945 于 2008-12-29 17:00 编辑

我整的规则,就差最后一步了,请兄弟们拉一把

电影名称
开始字符串:电影名称:
结束字符串:</li>

演员
开始字符串:电影演员:
结束字符串:</li>

分类
开始字符串:/index.html" target="_blank">
结束字符串:</a></li>

地区
开始字符串:<li>影片地区:
结束字符串:</li>

图片
开始字符串:<span><img src="
结束字符串:" alt="

简介
开始字符串:src='/Ad/14.js'></script></div><P>
结束字符串:</P>

播放地址:
开始字符串:var url="
结束字符串:";</script>
所属页面(多页):在默认页源代码内采集得到地址
正则匹配内容:/Player.asp?[参数].html
组合结果:/Play.asp?[参数1]


但是现在采集连续剧的时候只能采集第一集,我听人说应该要在标签编辑框内把“使用正则匹配内容”前面打上勾,还要再加点什么,请问下一步我该怎么做呀
 楼主| 发表于 2008-12-29 17:01:02 | 显示全部楼层
求助呀。。。。。。。。。。。。。。。。。。。
 楼主| 发表于 2008-12-30 08:26:30 | 显示全部楼层
兄弟们怎么都光看不顶
 楼主| 发表于 2008-12-30 11:29:41 | 显示全部楼层
有会多页采集的朋友帮我一把,我是把我原来电影站误删了,导致数据全部丢失,现在不采集的话,我就彻底倒下了。
发表于 2008-12-31 03:35:44 | 显示全部楼层
如果代码一样,就用分页采集试试看
头像被屏蔽
发表于 2009-1-4 17:24:56 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 12:32

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表