火车旅途随笔--火车来了让开--第16天使用火车头

小齐发表于 2007-10-21 09:46:14

前天晚上喝多了，昨天上午睡觉，下午和几个哥们去逛街了.
今天早上终于明白了---采集网址规则
开始采集地址：
1.点向导添加---批量/多页（这里是比较关键的一步，刚开始自己设置的时候，我乱设置通配符，根本就采集不到网址）
批量/多页：里面有一个数字变化范围：1到*（刚学习设置的时候看了孤魂的介绍也是乱设置，现在回头一下，我进步了一些.火影里面有句话挺有意思：”比昨天的自己强大“）最后点完成.
2.文章内容页面的地址必须包含：（这里还是天毅超斑教我的）不得包含：这里说的不得包含是对2级网址来说的(我是这么理解的).
3.页面选定区域采集网址：从什么到什么. 这里面需要用通配符来替换需要固定替换的内容.（我还没有使用过这个功能呢-_-）使用过的可以给举个例子.
4.自定义连接功能我还没有使用过呢？只看了孤魂使用标准版本的演示视频.
我还会继续写.......
我还是喜欢把自己新掌握的一些知识与大家分享.记录我和火车头的点点滴滴。与大家一起进步.

火车旅途随笔：ali27ls
火车旅途随笔--火车来了让开第13天使用火车头
用zlog采集终于成功了--第11天使用火车头
今天是第7天
今天是第5
今天是第3天学习火车头
今天是第4天学习火车头

xayjxyl 发表于 2007-10-21 11:28:09

顶你

其实把孤魂的视频教程看一遍,自己好好琢磨几次,一般的采集都没问题

天毅发表于 2007-10-21 12:56:35

不得包含这个不管你的采集深度是1还是2 都是指的是内容页面的
并不一定是二级页面

cike8588 发表于 2007-10-25 23:45:34

我也来学习学习!!!:ali10ls 加油!!!!

页: [1]

火车采集器软件交流官方论坛's Archiver

火车旅途随笔--火车来了让开--第16天使用火车头