页面中使用的是跳转页面怎么采集呢?
<META HTTP-EQUIV="Refresh" CONTENT="0; URL=http://www.studentboss.com/html/news/2009-06-22/24894.htm">我采集到的页面中就这个一句话,不能获得新的页面
这样的采集如何进行呢? http://www.studentboss.com/
要采集的就是这个网站的东西
遇到跳转了
就不会采集了! 老天啊 大地啊,人都哪里去了啊,有人能帮忙吗? 没看到那个页面有这个跳转页 http://www.studentboss.com/todaynews/newslist2.php?id=2&page=1
就是这个是 内容列表
自动获得的网站地址是:http://www.studentboss.com/todaynews/newsjj.php?id=24721
这个怎么采集呢,我使用自动采集的网站采集的都是是:
【内容】: <META HTTP-EQUIV="Refresh" CONTENT="0; URL=http://www.studentboss.com/html/news/2009-06-04/24721.htm">
【时间】: 2009-06-23 14:17:18
我该如何的修改! 本帖最后由 zhouchanglin 于 2009-6-23 14:37 编辑
网直可以蛀合出来 谢谢ls的大哥了谢谢了 我这就去看看 看看不错!!!! ali54ls 我下载了文件才知道是 xml的 我怎么使用呢,汗,不会啊 脚本;<DT><A href="newsjj.php?id=参数">*</A> <SPAN>参数</SPAN></DT>
实际连接;http://www.studentboss.com/html/news/[参数2]/[参数1].htm
不知道怎么上传的变 xml的 了,以前不会变的
页:
[1]
2