shenzhu 发表于 2007-10-16 19:40:57

原帖由 jdi 于 2007-10-16 18:16 发表 http://bbs.locoy.com/images/common/back.gif
有什么了不起. 就是用脚本写而已..
对付一般的菜鸟还可以...
   98% 的网页都能采集

那楼上能不能写个类似的脚本或者尝试防采集呢?
洗耳恭听..

流沙河 发表于 2007-10-16 20:21:53

原帖由 ljjk5 于 2007-10-9 09:47 发表 http://bbs.locoy.com/images/common/back.gif
这样的最好,搜索不能索引
sohu论坛的每个帖子几乎百度都收了?他们两家关系那么好?

lcw2000 发表于 2007-10-16 22:50:33

:lol

vvcc 发表于 2007-10-17 14:43:46

好像成功了?

学而时习之 发表于 2007-10-31 17:04:45

哪位采集成功的人士教一下,要求不多,给个思路就行,自己探索乐趣更多!

史巴托的腹肌 发表于 2007-11-1 23:48:55

谁说js的搜索不索引:(

fal 发表于 2007-11-13 02:31:28

看了下代码.结果差点吐血
拿下面这贴说.
http://club.astro.sohu.com/r-astrology-761300-0-159-0.html
看的很复杂


其实找到下面这地址就行了.
http://mirror4.club.sohu.com/readjsnew-astrology-761300-0.html
就写在源码里.
打开看后晕倒.
用个分页采集搞定.

学而时习之 发表于 2007-11-13 08:11:35

原帖由 fal 于 2007-11-13 02:31 发表 http://bbs.locoy.com/images/common/back.gif
看了下代码.结果差点吐血
拿下面这贴说.
http://club.astro.sohu.com/r-astrology-761300-0-159-0.html
看的很复杂


其实找到下面这地址就行了.
http://mirror4.club.sohu.com/readjsnew-astrology-761300-0 ...
:ali11ls :ali11ls 谢谢
页: 1 [2]
查看完整版本: 搜狐BBS有谁采集成功过?太奇怪了!源代码内无内容如何采集?