页面中使用的是跳转页面怎么采集呢？

upchum 发表于 2009-6-23 12:59:12

<META HTTP-EQUIV="Refresh" CONTENT="0; URL=http://www.studentboss.com/html/news/2009-06-22/24894.htm">
我采集到的页面中就这个一句话，不能获得新的页面
这样的采集如何进行呢？

upchum 发表于 2009-6-23 13:05:47

http://www.studentboss.com/
要采集的就是这个网站的东西
遇到跳转了
就不会采集了！

upchum 发表于 2009-6-23 13:59:14

老天啊大地啊，人都哪里去了啊，有人能帮忙吗？

monface 发表于 2009-6-23 14:04:18

没看到那个页面有这个跳转页

upchum 发表于 2009-6-23 14:17:44

http://www.studentboss.com/todaynews/newslist2.php?id=2&page=1
就是这个是内容列表
自动获得的网站地址是：http://www.studentboss.com/todaynews/newsjj.php?id=24721
这个怎么采集呢，我使用自动采集的网站采集的都是是：
【内容】： <META HTTP-EQUIV="Refresh" CONTENT="0; URL=http://www.studentboss.com/html/news/2009-06-04/24721.htm">
【时间】： 2009-06-23 14:17:18

我该如何的修改！

zhouchanglin 发表于 2009-6-23 14:35:51

本帖最后由 zhouchanglin 于 2009-6-23 14:37 编辑

网直可以蛀合出来

upchum 发表于 2009-6-23 14:38:55

谢谢ls的大哥了谢谢了我这就去看看

cshack 发表于 2009-6-23 14:54:26

看看不错!!!!

upchum 发表于 2009-6-23 15:03:08

ali54ls 我下载了文件才知道是 xml的我怎么使用呢，汗，不会啊

zhouchanglin 发表于 2009-6-23 15:46:52

脚本；<DT><A href="newsjj.php?id=参数">*</A> <SPAN>参数</SPAN></DT>

实际连接；http://www.studentboss.com/html/news/[参数2]/[参数1].htm

不知道怎么上传的变 xml的了，以前不会变的

页: [1] 2

火车采集器软件交流官方论坛's Archiver

页面中使用的是跳转页面怎么采集呢？