lssmtt 发表于 2009-4-17 21:24:27

想问下这样的图片内容页面应该怎么采集啊?

内容页是多个缩略图的,代码如下:
                                                             <div class="da2pic">
                                  <div class="d6bd">
                                    <a href="/pic_343478.html"><img src="http://img9.2u.com.cn/desk_pic/mid_344/343478.jpg"alt="梦幻卡通高清壁纸集19"/></a><br clear="all" />
                                    <div class="d6pictext"><a href="/pic_343478.html" title="梦幻卡通高清壁纸集19" class="hei12i">梦幻卡通高清壁纸集19</a></div>
                                    <div class="d6pictext">原图:1920×1200</div>
                                  </div>
                              </div>
                                                             <div class="da2pic">
                                  <div class="d6bd">
                                    <a href="/pic_343481.html"><img src="http://img9.2u.com.cn/desk_pic/mid_344/343481.jpg"alt="梦幻卡通高清壁纸集22"/></a><br clear="all" />
                                    <div class="d6pictext"><a href="/pic_343481.html" title="梦幻卡通高清壁纸集22" class="hei12i">梦幻卡通高清壁纸集22</a></div>
                                    <div class="d6pictext">原图:1920×1200</div>
                                  </div>
                              </div>
正常的内容应该是在如:<a href="/pic_343481.html">这样的页面里边
象这样的网站应该怎么采啊?
我搞了半天都搞不清楚,用多分页的话就只能采集到一张图片其他的都采集不了!
那位大虾可以教下吗?

wwwpsk 发表于 2009-4-17 22:01:11

自定义网地深度选址1,开始采集地址写你的这个页面地址,文章内容叶面写必须包涵/PIC_,这样就可以采集到你要的页面内容了!!

xyz5200 发表于 2009-4-17 22:16:30

这些代码就可以直接采集了

懷念過去↑文 发表于 2009-4-17 23:39:48

"<img src="参数"alt="*"/>
组合 参数1
循环采集

lssmtt 发表于 2009-4-18 10:06:36

"
组合 参数1
循环采集
懷念過去↑文 发表于 2009-4-17 23:39 http://bbs.locoy.com/images/common/back.gif
如果这样设置的话采集到的只是当前页面内容的缩略图啊!
真正的内容是在PCI开头的文件里边啊!
你们帮我看下:http://desk.2u.com.cn/
我想采的是这个站!
就是搞不定
页: [1]
查看完整版本: 想问下这样的图片内容页面应该怎么采集啊?