火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2601|回复: 0

(求助)自定义ID问题

[复制链接]
发表于 2011-4-18 09:46:44 | 显示全部楼层 |阅读模式
本帖最后由 dht9910 于 2011-4-18 11:09 编辑

不好意思发现错误是需要提取内容页面的栏目名字规则写错麻烦各位大大了由于着急粗心照成的在此对个位大大说声麻烦了!

看了论坛给位大大的关于自动分类的帖子,受益非浅,但有些地方还是有点迷糊,感觉转不过来弯了,

例如我要采集优酷的以下4个分类然不知道要怎么找着几个的分类ID了,先说说我的做法,新手大家别笑,
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2143.html     
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2147.html        
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2148.html        
http://www.youku.com/v_showlist/t1c91d1p<1,5,1,False,False>g2144.html  


首先我找的是列表页的分类ID的地方http://www.youku.com/v_showlist/t1c91d1p1g2143.html
<li><a href="/v_showlist/t1d1c91g2143.html" title="社会资讯" charset="1004-1-1-1001">社会资讯</a></li>
下面是在内容规则里然后新建自定义ID标签然后使用正则无法获取到分类的ID  (郁闷!)
<li><a href="(*)" title="(*)" charset="(*)">[参数]</a></li>

接着我在内容页面里找到<a href="http://www.youku.com/v_showlist/t2d1c91.html" charset="400-02-2" target="_blank">资讯列表</a>
规则里匹配<a href="http://www.youku.com/(*)" charset="(*)" target="_blank">[参数]</a>

但还是无法获取到栏目的ID我郁闷了,各位大大的教程看了很多遍了,但就是找不到原因在什么地方,求各位大大帮忙看看什么地方出错了谢谢各位大大~
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-1 23:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表