采集的网址中有. 获取不到内容
本帖最后由 tj05020 于 2013-5-14 21:57 编辑我采集的一个网站。他的访问网址有一部分是这样的
http://*****.com/abc_CO.,LTD.
都是公司名称来做网址的
结尾都带一个.
在获取内容时,看了下http请求 提示404
但浏览器访问都正常的,自带的http请求工具显示是404
后面没有点的都可以正常获取内容
这个有什么办法解决?
我试了一下内容采到了呢 上面的网址只是打个比方 tj05020 发表于 2013-5-12 15:55 static/image/common/back.gif
上面的网址只是打个比方
既然人家可以弄出来,那肯定不是那个点的问题,修改你的规则吧。 那个网址不是 用那个网址当然是没有问题的
页:
[1]