zx4444 发表于 2010-3-3 15:52:00

采集歌词吾爱各个版本都不能采二级页面

本来想采集 歌词吾爱的 全站歌词

发现用20082009   2010测试版都不能采到2级页面

本来想从 男歌手页面
http://www.51lrcgc.com/htm/singer/singer1.htm

到歌手 专辑列表
http://www.51lrcgc.com/htm/singer/S/SbNN4X.htm

再到歌曲列表
http://www.51lrcgc.com/htm/singer/S/SbNN4X.htm   


最后到
http://www.51lrcgc.com/htm/album/200912/JE02m9mRkD1P56.htm
以这个为列表页面

http://www.51lrcgc.com/asp/showlyrics.asp?id=200912138kC3aH 这个为内容发觉太多级了


后来改用

歌曲列表
http://www.51lrcgc.com/htm/singer/S/SbNN4X.htm   



http://www.51lrcgc.com/htm/album/200912/JE02m9mRkD1P56.htm
以这个为列表页面

发觉二级页面 还是识别不出来

最后用了3个规则第一个规则采集这个页面
http://www.51lrcgc.com/htm/singer/singer4.htm
在测试列表地址那里导出 所有男歌手的地址

第二规则导入上面的地址去采集每张专辑地址
结果 就在测试列表地址处卡住了跳出错误哎 求助

rq204 发表于 2010-3-3 16:30:17

二级是可以采的呀,(2010测试版)

zx4444 发表于 2010-3-3 16:42:08

本帖最后由 zx4444 于 2010-3-3 16:44 编辑

采集网址深度二级阿

都试过不行 在群里让一个朋友试了 也不行 他是2009

我在用2010和2009    采集一集目录的地址 出错卡住我还是把规则发上来


这是马上快刷完地址的时候

zx4444 发表于 2010-3-3 16:46:38

我看了下 出错的位置
http://www.51lrcgc.com/htm/singer/H/HlWaP016.htm

貌似每次都是到它就卡住或出错

直接扔到内存页面去 采集 发现也是提示出错

难道和俞灏明八字不和?

zx4444 发表于 2010-3-4 14:52:08

还没解决呢又试了多个版本
把2010的规则附上

还有采集那个地址 只有2010会出错
页: [1]
查看完整版本: 采集歌词吾爱各个版本都不能采二级页面