断肠人 发表于 2008-8-22 09:43:18

这个2级深度,不会采了,求助

我想采九天音乐网的专辑。只能用2级深度。
    第一步,专辑列表。页面:http://www.9sky.com/music/albumPoly/1/genre-cn 。然后进入专辑内容区。各种设置正常。
    第二步,进入一个我想采集的页面:http://www.9sky.com/music/album/48384#@。专辑名、歌手名、转辑介绍什么都弄好了。但是它出来的还是列表。晕。不会了。
    请各位大侠帮个忙,解决两个问题:
    1、如何对此列表再次进行采集?
    2、即使采集成内容了,如何存表?内容必须存在两个表内,即A表布专辑的信息,B表存专辑内的歌曲。

chenfy 发表于 2008-8-22 09:58:50

可去看看这边,http://bbs.locoy.com/spider-29288-1-1.html,这里有二级网址的采集规则,当然,你这个的话要涉及手动链接,刚刚这个网址里附件里有一个第一步的那个里面有手动链接,采集不到网址列表可以说基本上都是要到手动里面去设置。
还有一个,你说的要存两个表,不知道你是要怎么样存,我最初的想法就是你分两个任务来采集

ghostscat 发表于 2008-8-22 11:01:37

先采集http://www.9sky.com/music/albumPoly/1/genre-cn 他的网址列表,导出二级节点网址,再导入
然后设置2级采集就可以了

chyy 发表于 2008-8-22 18:31:07

这个采集有什么用啊,应该是防盗链的
页: [1]
查看完整版本: 这个2级深度,不会采了,求助