29 123
发新话题
打印

[3.2版] 迅雷全站资源规则,已经成功采集8w条数据【4月13日1:35分编辑】

迅雷全站资源规则,已经成功采集8w条数据【4月13日1:35分编辑】

迅雷资源的全站规则 可以采集迅雷官方网站上的所有资源
http://pstatic.xunlei.com/channel1/index.htm 影视
http://pstatic.xunlei.com/channel2/index.htm音乐
http://pstatic.xunlei.com/channel3/index.htm游戏
http://pstatic.xunlei.com/channel4/index.htm软件
http://pstatic.xunlei.com/channel5/index.htm书籍
http://pstatic.xunlei.com/channel6/index.htm手机

迅雷单项列表一共是100页 所以一次你可能采集不了那么多的内容,换个方式多采集几次即可

列表页面自己制作
采集内容类似
http://content.gougou.com/content?cid=E72B11CE302F1728CBACE46F6B66BA88D4B786BE

如有问题请跟帖说明
ps:
1由于现在迅雷资源内容页面自动跳转到gougou上 所以采集网址结束后需要修改下采集的网址
采集效果如图

近期将发布几个新站点规则
一个war3.uuu9.com的魔兽rpg规则 如果想帮忙测试的请pm我,花了不少心思,改进了很多次,支持分页采集,特别是完美的解决了uuu9网站本身对于图片的防盗链
一个是游戏外挂的 这个只有几千条数据
一个网游经验的 这个很多 大概10w+ 个人数据库空间太少 不敢采太多 一般都只采20页 就那也5w多的数据了,一般游戏都是50页+的热门游戏比如魔兽世界这些都是200页以上 每页30条 数据量可想而知

回10楼
引用:
原帖由 天性 于 2008-4-10 16:26 发表
晕..  迅雷好乱..  我是连列表页面都找不出来!!  能否指教下? 谢!
列表页面看我最上面发的那个链接
那就是总链接

回15楼
引用:
原帖由 土匪李 于 2008-4-13 16:50 发表
为什么下载地址采集不出来???

怪事。
迅雷已经做出一些调整
列表页面采集的内容页是http://wstatic.xunlei.com/content/3CF9C4AC6B19A153D338C7A9A31BC0F4386321F0.html
规则对应的页面是http://content.gougou.com/content?cid=3CF9C4AC6B19A153D338C7A9A31BC0F4386321F0
需要用数据库工具替换一下
比如把http://wstatic.xunlei.com/content/ 替换成http://content.gougou.com/content?
.html 去掉

[ 本帖最后由 pakey 于 2008-4-14 02:32 编辑 ]
附件: 您所在的用户组无法下载或查看附件

TOP

规则这里下

[ 本帖最后由 pakey 于 2008-4-9 03:35 编辑 ]
附件: 您所在的用户组无法下载或查看附件
本帖最近评分记录
  • 飛越無限 火车车厢 +3 发布共享规则 2008-4-9 09:42

TOP

sofa

TOP

感谢楼主!!!

TOP

支持共享
火车头商业版购买与咨询、火车高难度采集、全站采集入库服务、采集规则定制、web在线发布、入库模块定制等业务、大家多多支持呀!联系QQ:86020004
┏┄┄┄┄站长交流中心┄┄┄┄┓
┇ 欢迎大家加入以下群,此群组主要为各位从事计算机爱好者服务欢迎各位高手加盟共同学习QQ群號:7830012  4671518┇

TOP

强人!~~我顶·!

TOP

这个猛!!!

TOP

提示: 作者被禁止或删除 内容自动屏蔽

TOP

飛越好小气
这么好的资源才给3个车厢

TOP

晕..  迅雷好乱..  我是连列表页面都找不出来!!  能否指教下? 谢!

TOP

 29 123
发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.153458 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-15 03:01 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档