tj05020 发表于 2013-5-12 14:48:59

采集的网址中有. 获取不到内容

本帖最后由 tj05020 于 2013-5-14 21:57 编辑

我采集的一个网站。他的访问网址有一部分是这样的

http://*****.com/abc_CO.,LTD.

都是公司名称来做网址的
结尾都带一个.
在获取内容时,看了下http请求 提示404
但浏览器访问都正常的,自带的http请求工具显示是404

后面没有点的都可以正常获取内容

这个有什么办法解决?

303718 发表于 2013-5-12 14:55:29

我试了一下内容采到了呢

tj05020 发表于 2013-5-12 15:55:17

上面的网址只是打个比方

lmj243 发表于 2013-5-12 19:12:58

tj05020 发表于 2013-5-12 15:55 static/image/common/back.gif
上面的网址只是打个比方

既然人家可以弄出来,那肯定不是那个点的问题,修改你的规则吧。

tj0502 发表于 2013-5-14 21:56:05

那个网址不是 用那个网址当然是没有问题的
页: [1]
查看完整版本: 采集的网址中有. 获取不到内容