dht9910 发表于 2011-4-18 09:46:44

(求助)自定义ID问题

本帖最后由 dht9910 于 2011-4-18 11:09 编辑

不好意思发现错误是需要提取内容页面的栏目名字规则写错麻烦各位大大了由于着急粗心照成的在此对个位大大说声麻烦了!

看了论坛给位大大的关于自动分类的帖子,受益非浅,但有些地方还是有点迷糊,感觉转不过来弯了,

例如我要采集优酷的以下4个分类然不知道要怎么找着几个的分类ID了,先说说我的做法,新手大家别笑,
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2143.html   
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2147.html      
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2148.html      
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2144.html


首先我找的是列表页的分类ID的地方http://www.youku.com/v_showlist/t1c91d1p1g2143.html
<li><a href="/v_showlist/t1d1c91g2143.html" title="社会资讯" charset="1004-1-1-1001">社会资讯</a></li>
下面是在内容规则里然后新建自定义ID标签然后使用正则无法获取到分类的ID(郁闷!)
<li><a href="(*)" title="(*)" charset="(*)">[参数]</a></li>

接着我在内容页面里找到<a href="http://www.youku.com/v_showlist/t2d1c91.html" charset="400-02-2" target="_blank">资讯列表</a>
规则里匹配<a href="http://www.youku.com/(*)" charset="(*)" target="_blank">[参数]</a>

但还是无法获取到栏目的ID我郁闷了,各位大大的教程看了很多遍了,但就是找不到原因在什么地方,求各位大大帮忙看看什么地方出错了谢谢各位大大~
页: [1]
查看完整版本: (求助)自定义ID问题