火车头 发表于 2009-3-25 10:22:38

#是锚点连接符

所以程序自动忽略了这个标记,而认为是一个页面,其实它本来就是一个页面

alexai 发表于 2009-3-25 11:16:20

哦!!!!!!!!!!!

jingyuan007 发表于 2009-3-25 13:07:55

不是一个页面的 http://top.sogou.com/ 这个 那些#页面怎么采集 谢谢

jingyuan007 发表于 2009-3-25 13:30:10

我先采集这个页面http://top.sogou.com/index.html#000001 结果出来是http://top.sogou.com/index.html这样的源码 怎么办啊

jingyuan007 发表于 2009-3-26 08:58:57

ali68ls ali71ls
页: [1]
查看完整版本: 采集带index.html#00003形式的网址怎么采集