| | 1 | 2 | 3 | 4 | 5 | 6 | | 7 | 8 | 9 | 10 | 11 | 12 | 13 | | 14 | 15 | 16 | 17 | 18 | 19 | 20 | | 21 | 22 | 23 | 24 | 25 | 26 | 27 | | 28 | 29 | 30 | | | | | |
|
我采集淘宝里面的数据,但宝贝介绍,描述之类的却弄不到,在源文件里面没有,像这种网站要怎么采集?另一个就是宝贝数量之类的,看起来是空格,但把这些空格排除一点点又把数字给弄没了,就比如下面的图片,把16件前面的空格弄掉,哪怕只是弄掉一点点,但都会没有16件这个数字了,这个是怎么回事呢?
说明:此规则是3级深度网址的采集规则,如果你想采集更多深度的网址,只要学会这个方法一样可以采集。当然,步骤要分几步,方法和规则都在附件里,三级网址方法用图片和文字来说明http://www.yuanwen.com/book/SortMore.asp?type=1&page=1这个是版块列表,大家可看看,懂的采集的可以不用理会,不懂的可借鉴,此方法 ...
辛辛苦苦收集了很久,到现在收集了最少有300个规则,其中大部份在网上找的,也有一部份是自己制作,里面有收费规则,也有免费规则,有高手制作,也有新手作品,只要有了这个规则集合,我相信你不用再去问别人规则的制作了,你只要多多看几个规则,我相信你就能明白,原来规则也不是很难啊。 下了的人都没有回贴的 ...
我有看到论坛上的坛友们说好像是两个任务,合并成一个,后来有一个版主说数据库合并,那么这个数据库合并是怎么回事?要怎么合并?
看了这个“练习题 偶失败鸟。。。采不到网易博客搜索”http://bbs.locoy.com/spider-29900-1-1.html但我做出来的却问题多多第一:看过那个帖子说用自定义链接,但我去搜索结果里那边点源文件,但却找不到搜索结果,结果如下:网易博客搜索博 ...
|
|