upchum 发表于 2009-6-23 12:59:12

页面中使用的是跳转页面怎么采集呢?

<META HTTP-EQUIV="Refresh" CONTENT="0; URL=http://www.studentboss.com/html/news/2009-06-22/24894.htm">
我采集到的页面中就这个一句话,不能获得新的页面
这样的采集如何进行呢?

upchum 发表于 2009-6-23 13:05:47

http://www.studentboss.com/
要采集的就是这个网站的东西
遇到跳转了
就不会采集了!

upchum 发表于 2009-6-23 13:59:14

老天啊 大地啊,人都哪里去了啊,有人能帮忙吗?

monface 发表于 2009-6-23 14:04:18

没看到那个页面有这个跳转页

upchum 发表于 2009-6-23 14:17:44

http://www.studentboss.com/todaynews/newslist2.php?id=2&page=1
就是这个是 内容列表
自动获得的网站地址是:http://www.studentboss.com/todaynews/newsjj.php?id=24721
这个怎么采集呢,我使用自动采集的网站采集的都是是:
【内容】: <META HTTP-EQUIV="Refresh" CONTENT="0; URL=http://www.studentboss.com/html/news/2009-06-04/24721.htm">
【时间】: 2009-06-23 14:17:18

我该如何的修改!

zhouchanglin 发表于 2009-6-23 14:35:51

本帖最后由 zhouchanglin 于 2009-6-23 14:37 编辑

网直可以蛀合出来

upchum 发表于 2009-6-23 14:38:55

谢谢ls的大哥了谢谢了 我这就去看看

cshack 发表于 2009-6-23 14:54:26

看看不错!!!!

upchum 发表于 2009-6-23 15:03:08

ali54ls 我下载了文件才知道是 xml的 我怎么使用呢,汗,不会啊

zhouchanglin 发表于 2009-6-23 15:46:52

脚本;<DT><A href="newsjj.php?id=参数">*</A> <SPAN>参数</SPAN></DT>

实际连接;http://www.studentboss.com/html/news/[参数2]/[参数1].htm

不知道怎么上传的变 xml的 了,以前不会变的
页: [1] 2
查看完整版本: 页面中使用的是跳转页面怎么采集呢?