都市乞丐 发表于 2008-1-19 13:44:17

中国新闻网文章内容页面采集问题(问题还没解决)

设置采集规则发现,如果网址是这样的格式就采集不到,不知道为什么。。。。 请求帮助。。。

http://www.chinanews.com.cn//gn/news/2008/01-18/1139037.shtml  (网址中含有 "//")

采集地址: http://61.135.173.47:6666/Outlin ... annelID=4832&RecID=

[ 本帖最后由 都市乞丐 于 2008-1-20 19:18 编辑 ]

Terminal 发表于 2008-1-19 13:53:00

ali17ls   

一样的采,两根和一根一个意思

都市乞丐 发表于 2008-1-19 13:55:22

原帖由 Terminal 于 2008-1-19 13:53 发表 http://bbs.locoy.com/images/common/back.gif
ali17ls   

一样的采,两根和一根一个意思

我用软件抓不到网址。。。。

vus520 发表于 2008-1-19 14:17:38

不管能不能采到,如果不用手动匹配链接,我喜欢这样定位链接!
/news/2

都市乞丐 发表于 2008-1-19 14:26:04

原帖由 vus520 于 2008-1-19 14:17 发表 http://bbs.locoy.com/images/common/back.gif
不管能不能采到,如果不用手动匹配链接,我喜欢这样定位链接!
/news/2

目前还不会设置 手动匹配。。。

“/news/2” 并不能自动定位连接尝试了多种判断标志,都失败告终。

都市乞丐 发表于 2008-1-20 19:19:20

不知道为什么。。。。 请求帮助。。。
页: [1]
查看完整版本: 中国新闻网文章内容页面采集问题(问题还没解决)