14 12
发新话题
打印

Netdream请进

Netdream请进

要采集公司的信息,这个多页二级连接怎么设置?主页面http://www.114chn.com/web/enterprise/second.asp?page=1&ar=深圳市&cid=440300?谢谢啦.下面是要采集的地址:<b><a href=EnterpriseShow.Asp?cid=4403060601200001 class="gongying5" target="_blank">

[ 本帖最后由 sunway888 于 2006-6-12 15:29 编辑 ]

TOP

还有一点,在IE中查看源文件时,列表页中可以看到的联系信息,在火车中却看不到,需要设置多级分页才行?

TOP

你把主页面地址换成这样
复制内容到剪贴板
代码:
http://www.114chn.com/web/enterprise/second.asp?page=1&ar=%C9%EE%DB%DA%CA%D0&cid=440300

TOP

引用:
原帖由 sunway888 于 2006-6-12 15:39 发表
还有一点,在IE中查看源文件时,列表页中可以看到的联系信息,在火车中却看不到,需要设置多级分页才行?
火车在取列表时只取里面的链接地址,所以你在火车中看不到联系信息。

TOP

引用:
原帖由 netdream 于 2006-6-12 16:22 发表
你把主页面地址换成这样
复制内容到剪贴板
代码:
http://www.114chn.com/web/enterprise/second.asp?page=1&ar=%C9%EE%DB%DA%CA%D0&cid=440300
谢谢.原来是把中文字符替换掉,ok了.但是在"全局配置-新建规则-采集页面测试"中,如这个页面http://www.114chn.com/web/enterprise/EnterpriseShow.Asp?cid=4403060511030001,为何全面是乱码?

[ 本帖最后由 sunway888 于 2006-6-12 17:27 编辑 ]

TOP

乱码

乱码

TOP

乱码

乱码
附件: 您所在的用户组无法下载或查看附件

TOP

NetDream在么?老大看看呀

TOP

编码选utf-8

TOP

引用:
原帖由 netdream 于 2006-6-12 18:29 发表
编码选utf-8
yes

TOP

 14 12
发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.146890 second(s), 7 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-10-8 04:21 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档