12 12
发新话题
打印

新浪的这个页面就真的无法采集到地址了?

新浪的这个页面就真的无法采集到地址了?

已经解决

[ 本帖最后由 沦陷今生 于 2006-7-31 14:23 编辑 ]

TOP

@_@敬请高手指教..给些提示也好

TOP

它的实现原理是在一页之内用html语法直接控制显示的内容 也就是直接到同一个页面的不同位置而已
所以你在采集的时候根本就不用理会分页信息  直接就填写这个页面:
http://eat.sina.com.cn/more/txmw.html

仔细检查源码我们可以看到诸如此类的代码
        data_p[398]=new Array();
        data_p[398][0]='千奇百怪的西方国宴(组图)';
        data_p[398][1]='http://eat.sina.com.cn/art/2005-08-10/104613162.shtml';
        data_p[398][2]='(8-10)';

这个太好办了 还是有绝对地址在里边的哦!

TOP

直接填写这个页面的话...底下分页里的信息没有出现

TOP

搞定了吗?

TOP

引用:
原帖由 沦陷今生 于 2006-7-29 10:21 发表
直接填写这个页面的话...底下分页里的信息没有出现
还要什么分页信息啊
它所有的信息链接都在这个页面里了
只要填写好采集链接的条件就好了啊

TOP

回复 #6 天毅 的帖子

:D就是请教 如何 写采集连接的条件。///:D

TOP

多谢提点。已经自行解决

TOP

已经解决

[ 本帖最后由 沦陷今生 于 2006-7-31 15:00 编辑 ]

TOP

已经解决!

[ 本帖最后由 沦陷今生 于 2006-7-31 15:00 编辑 ]

TOP

 12 12
发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.246901 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-22 04:48 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档