bcbkill147 发表于 2012-12-19 21:08:48

请问这个怎样采集?

本帖最后由 bcbkill147 于 2012-12-19 21:12 编辑

百度文库http://www.baidu.com/p/aidyyang?from=wenku
我只想采集标题,不用采集内容。但是用火车头采集不到链接....................

请问这种要怎样采集!先多谢专家们!!

zml123 发表于 2012-12-20 09:10:16

可以直接从列表页采集,也可以到内容页采集!

kuhabe 发表于 2012-12-20 09:57:36



抓包 找到真实地址
http://wenku.baidu.com/user/phome?portrait=166b6169647979616e67d30c&st=1&domain=http://www.baidu.com/p

然后根据真实地址 去采集,
列表页采集标签教程
http://bbs.locoy.com/spider-108117-1-1.html

可以参考学习下

bcbkill147 发表于 2012-12-20 12:38:15

kuhabe 发表于 2012-12-20 09:57 static/image/common/back.gif
抓包 找到真实地址
http://wenku.baidu.com/user/phome?portrait=166b6169647979616e67d30c&st=1&doma ...

专家,请问怎样抓包。。有没有教程!!多谢

kuhabe 发表于 2012-12-20 12:55:16

bcbkill147 发表于 2012-12-20 12:38 static/image/common/back.gif
专家,请问怎样抓包。。有没有教程!!多谢

教程
http://bbs.locoy.com/spider-107387-1-1.html
http://bbs.locoy.com/spider-66994-1-1.html
页: [1]
查看完整版本: 请问这个怎样采集?