sunway888 发表于 2006-6-12 15:25:15

Netdream请进

要采集公司的信息,这个多页二级连接怎么设置?主页面http://www.114chn.com/web/enterprise/second.asp?page=1&ar=深圳市&cid=440300?谢谢啦.下面是要采集的地址:<b><a href=EnterpriseShow.Asp?cid=4403060601200001 class="gongying5" target="_blank">

[ 本帖最后由 sunway888 于 2006-6-12 15:29 编辑 ]

sunway888 发表于 2006-6-12 15:39:44

还有一点,在IE中查看源文件时,列表页中可以看到的联系信息,在火车中却看不到,需要设置多级分页才行?

netdream 发表于 2006-6-12 16:22:34

你把主页面地址换成这样
http://www.114chn.com/web/enterprise/second.asp?page=1&ar=%C9%EE%DB%DA%CA%D0&cid=440300

netdream 发表于 2006-6-12 16:29:50

原帖由 sunway888 于 2006-6-12 15:39 发表
还有一点,在IE中查看源文件时,列表页中可以看到的联系信息,在火车中却看不到,需要设置多级分页才行?
火车在取列表时只取里面的链接地址,所以你在火车中看不到联系信息。

sunway888 发表于 2006-6-12 17:25:40

原帖由 netdream 于 2006-6-12 16:22 发表
你把主页面地址换成这样
http://www.114chn.com/web/enterprise/second.asp?page=1&ar=%C9%EE%DB%DA%CA%D0&cid=440300

谢谢.原来是把中文字符替换掉,ok了.但是在"全局配置-新建规则-采集页面测试"中,如这个页面http://www.114chn.com/web/enterprise/EnterpriseShow.Asp?cid=4403060511030001,为何全面是乱码?

[ 本帖最后由 sunway888 于 2006-6-12 17:27 编辑 ]

sunway888 发表于 2006-6-12 17:42:12

乱码

乱码

sunway888 发表于 2006-6-12 17:44:27

乱码

乱码

sunway888 发表于 2006-6-12 18:20:10

NetDream在么?老大看看呀

netdream 发表于 2006-6-12 18:29:57

编码选utf-8

sunway888 发表于 2006-6-12 19:02:47

原帖由 netdream 于 2006-6-12 18:29 发表
编码选utf-8

yes
页: [1] 2
查看完整版本: Netdream请进