火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2931|回复: 2

这个美女图片站规则那个爷们会写?

[复制链接]
发表于 2009-12-3 14:01:16 | 显示全部楼层 |阅读模式
刚接触火车头,学采集,看到一个美女图片站,写了规则,采不到图片,列表页面规则有2个,不知道怎么写,下面是这个站
[我不写域名了,免得站长兄弟来K我,纯粹是学习交流,没有恶意,google搜“美女图片”,排在第一的那个站,]
我用的火车头是LocoySpiderV2009SP4_Build20090807的。

栏目:国产美女

此栏目地址:域名/meinv/guochanmeinvtupian/   页面有很多图片,页面下面的“上一页”“下一页”部位链接是

/meinv/guochanmeinvtupian/list_2_1.html
/meinv/guochanmeinvtupian/list_2_2.html
/meinv/guochanmeinvtupian/list_2_3.html
···
【代码: <div class="pagenew">
   <ul class="pagelist">
             <li><a href='list_2_1.html'>首页</a></li>
<li><a href='list_2_4.html'>上一页</a></li>
<li><a href='list_2_1.html'>1</a></li>
<li><a href='list_2_2.html'>2</a></li>
<li><a href='list_2_3.html'>3</a></li>
<li><a href='list_2_4.html'>4</a></li>
<li class="thisclass">5</li>
<li><a href='list_2_6.html'>6</a></li>
<li><a href='list_2_7.html'>7</a></li>
<li><a href='list_2_8.html'>8</a></li>
<li><a href='list_2_9.html'>9</a></li>
<li><a href='list_2_10.html'>10</a></li>
<li><a href='list_2_11.html'>11</a></li>
<li><a href='list_2_6.html'>下一页</a></li>
<li><a href='list_2_20.html'>末页</a></li>
   </ul>
    </div>
</DIV>】

点击这个页面其中一个图片“纯美少女”,进去 /meinv/guochanmeinvtupian/2006.html  是一副图片的内容页面,

图片下面是“上一页”“下一页”部位链接,形式是
/meinv/guochanmeinvtupian/2006_2.html
/meinv/guochanmeinvtupian/2006_3.html
/meinv/guochanmeinvtupian/2006_4.html
···
从2006.html 到 2006_20.html 都是一个人的不同照片,也就是要采集的图片内容页面,注意:没有2006_1.html。

【页面代码<!--<div class="page"><ul><a>共17页: </a><a href='2006.html'>上一页</a><a href='2006.html'>1</a><a class="thisclass" href='#'>2</a><a href='2006_3.html'>3</a><a href='2006_4.html'>4</a><a href='2006_5.html'>5</a><a href='2006_6.html'>6</a><a href='2006_7.html'>7</a><a href='2006_8.html'>8</a><a href='2006_9.html'>9</a><a href='2006_10.html'>10</a><a href='2006_11.html'>11</a><a href='2006_12.html'>12</a><a href='2006_13.html'>13</a><a href='2006_14.html'>14</a><a href='2006_15.html'>15</a><a href='2006_16.html'>16</a><a href='2006_17.html'>17</a><a href='2006_3.html'>下一页</a></ul></div>-->
<div class="pagenew">
   <div class="pagelist">
             <a>共17页: </a><a href='2006.html'>上一页</a><a href='2006.html'>1</a><a class="thisclass" href='#'>2</a><a href='2006_3.html'>3</a><a href='2006_4.html'>4</a><a href='2006_5.html'>5</a><a href='2006_6.html'>6</a><a href='2006_7.html'>7</a><a href='2006_8.html'>8</a><a href='2006_9.html'>9</a><a href='2006_10.html'>10</a><a href='2006_11.html'>11</a><a href='2006_12.html'>12</a><a href='2006_13.html'>13</a><a href='2006_14.html'>14</a><a href='2006_15.html'>15</a><a href='2006_16.html'>16</a><a href='2006_17.html'>17</a><a href='2006_3.html'>下一页</a>
   </div>】

其他栏目页面形式都和这个一样

【只是 list_2_1.html 这里的“2”变化,应该是栏目ID,后面的“1”根据组图的多少++数字变化,,
2006_2.html 这个页面,“2006”数字也是变化的,从“1”一直到 2000多,后面的“2”也是变化的,】

【内容页面:</div>
      </div>
      <div class="wzbody"><img alt="绝美少女2" border="0" src="/img/0909012/2.jpg" /></div>
      <div class="tm6">】

这样的图片站,采集规则怎么写呢?尤其是分页那里怎么写?应该写那个呢?为什么我采不到图片呢,采集完毕了,图片保存在那里?怎么看啊?
 楼主| 发表于 2009-12-4 11:54:41 | 显示全部楼层
怎么没有人顶下啊
发表于 2009-12-7 10:52:50 | 显示全部楼层
只能说是帮顶了
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-25 08:21

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表