为什么这样的网址在浏览器里可以有内容,采集器不行
我有个这样的网址,我想采集这样很多类似的网址:http://clinicaltrials.gov/ct2/results/details?term=eurosurgery Instruments
http://clinicaltrials.gov/ct2/results/details?term=Dental Extracting Forceps
上面这二条网址,填在浏览器里有效,但用python的urllib打不开显404错误好像,我尝试过把后面的空格转成ANSI码,也没有用
请问哪位朋友知道解决方法,感谢了
?号在火车头貌似不识别!
再看看吧!
所以很多有?的网址都有点点问题! 应该网址有误吧。浏览器行的一般火车头都行的。
页:
[1]