tony5808lee 发表于 2013-6-14 08:40:25

希望火车头采集器能模拟浏览器访问网页

您好:我在采集网页http://www.thecompleteuniversityguide.co.uk/league-tables/rankings?s=Business+%26+Management+Studies 时无法获得“标题”。后来发现:用IE浏览器访问该网页获得的源代码与用火车头采集器访问该网页获得的源代码不同。前者包括关键词“Business & Management Studies”, 而后者不包括关键词“Business & Management Studies”。 希望火车头采集器能模拟浏览器访问网页,就能克服一些网页中包含的“防采集”功能。另外用“从网址中采集”功能(在“标签编辑”页面的右上角)也无法获得关键词“Business+%26+Management+Studies“。希望高手能告诉我怎样采集到关键词“Business & Management Studies”。谢谢。

303718 发表于 2013-6-14 08:53:13

本来就支持的呢。规则的第一步最下面就是

tony5808lee 发表于 2013-6-14 10:03:47

谢谢回复。确实包含此功能。谢谢

巴菲特俊哥 发表于 2013-6-16 13:31:23

希望火车头采集器能模拟浏览器访问网页,

lbjyuer 发表于 2016-2-10 16:10:29

爪,以后学习下。。
页: [1]
查看完整版本: 希望火车头采集器能模拟浏览器访问网页