采集带index.html#00003形式的网址怎么采集 - 采集器基础使用讨论区 - 火车采集器软件交流官方论坛

火车头 发表于 2009-3-25 10:22:38

#是锚点连接符

所以程序自动忽略了这个标记，而认为是一个页面，其实它本来就是一个页面

alexai 发表于 2009-3-25 11:16:20

哦!!!!!!!!!!!

jingyuan007 发表于 2009-3-25 13:07:55

不是一个页面的 http://top.sogou.com/ 这个那些#页面怎么采集谢谢

jingyuan007 发表于 2009-3-25 13:30:10

我先采集这个页面http://top.sogou.com/index.html#000001 结果出来是http://top.sogou.com/index.html这样的源码怎么办啊

jingyuan007 发表于 2009-3-26 08:58:57

ali68ls ali71ls

页: [1]

火车采集器软件交流官方论坛's Archiver