[求助]求不在同一页面的采集规则
我要采集此站www.bbb119.com
他们的电影简介、图片等相关介绍在第一页
http://www.bbb119.com/Action%20movie/a943a0e0d738377f.html
点开播放后,只是出现的一个静态页面,并不是数据的有效地址
http://www.bbb119.com/Player.asp?3954,1,6,1.html
在继续查看源文件,发现他是调用此页的
http://www.bbb119.com/Play.asp?3954,1,6,1
进入此页后,查看源代码,才能找到他的数据地址
http://61.191.63.83:8032/222713727/0925F51DB2023FB4EA302A11735A0B6C3D80A717/叶问 抢先版.rmvb
现在请问:
如何将他第一页的电影简介、图片等相关介绍,与他最后一页的数据地址同时采集呢?
就是红字标出的那些!!!!求采集规则
再次感谢各位火车达人的帮助 不会,帮楼主顶起来。 用多页采集可以实现,论坛里有教程,可以参考一下这个教程http://bbs.locoy.com/viewthread.php?tid=19527&extra=page%3D1&frombbs=1 晕倒,楼上的还要车箱,我全在这帖了。要不你帮我一下,我三节全给你
我弄的规则,应该还差最后一步
本帖最后由 gunjack945 于 2008-12-29 17:00 编辑我整的规则,就差最后一步了,请兄弟们拉一把
电影名称
开始字符串:电影名称:
结束字符串:</li>
演员
开始字符串:电影演员:
结束字符串:</li>
分类
开始字符串:/index.html" target="_blank">
结束字符串:</a></li>
地区
开始字符串:<li>影片地区:
结束字符串:</li>
图片
开始字符串:<span><img src="
结束字符串:" alt="
简介
开始字符串:src='/Ad/14.js'></script></div><P>
结束字符串:</P>
播放地址:
开始字符串:var url="
结束字符串:";</script>
所属页面(多页):在默认页源代码内采集得到地址
正则匹配内容:/Player.asp?[参数].html
组合结果:/Play.asp?[参数1]
但是现在采集连续剧的时候只能采集第一集,我听人说应该要在标签编辑框内把“使用正则匹配内容”前面打上勾,还要再加点什么,请问下一步我该怎么做呀 求助呀。。。。。。。。。。。。。。。。。。。ali66ls 兄弟们怎么都光看不顶 有会多页采集的朋友帮我一把,我是把我原来电影站误删了,导致数据全部丢失,现在不采集的话,我就彻底倒下了。 如果代码一样,就用分页采集试试看
页:
[1]