小齐 发表于 2007-10-21 09:46:14

火车旅途随笔--火车来了让开--第16天使用火车头

前天晚上喝多了,昨天上午睡觉,下午和几个哥们去逛街了.
今天早上终于明白了---采集网址规则
开始采集地址:
    1.点向导添加---批量/多页(这里是比较关键的一步,刚开始自己设置的时候,我乱设置通配符,根本就采集不到网址)
                批量/多页:里面有一个数字变化范围:1到*(刚学习设置的时候看了孤魂的介绍也是乱设置,现在回头一下,我进步了一些.火影里面有句话挺有意思:”比昨天的自己强大“)   最后点完成.
    2.文章内容页面的地址必须包含:(这里还是天毅超斑教我的)   不得包含:这里说的不得包含是对2级网址来说的(我是这么理解的).
    3.页面选定区域采集网址:从什么到什么. 这里面需要用通配符来替换需要固定替换的内容.(我还没有使用过这个功能呢-_-)使用过的可以给举个例子.
    4.自定义连接功能我还没有使用过呢?只看了孤魂使用标准版本的演示视频.
我还会继续写.......
我还是喜欢把自己新掌握的一些知识与大家分享.记录我和火车头的点点滴滴。与大家一起进步.




火车旅途随笔:ali27ls
火车旅途随笔--火车来了让开第13天使用火车头
用zlog采集终于成功了--第11天使用火车头
今天是第7天
今天是第5
今天是第3天 学习火车头
今天是第4天 学习火车头




xayjxyl 发表于 2007-10-21 11:28:09

顶你

其实把孤魂的视频教程看一遍,自己好好琢磨几次,一般的采集都没问题

天毅 发表于 2007-10-21 12:56:35

不得包含 这个不管你的采集深度是1还是2 都是指的是内容页面的
并不一定是二级页面

cike8588 发表于 2007-10-25 23:45:34

我也来学习学习!!!:ali10ls 加油!!!!
页: [1]
查看完整版本: 火车旅途随笔--火车来了让开--第16天使用火车头