火车头如何采集多页百度搜索指定关键字的网址
火车头采集器如何采集网页上的网址,我只要网址不想要其他文章,比如http://www.baidu.com/s?wd=%D2%A6%C3%F7&word=%D2%A6%C3%F7&tn=sitehao123这个是在百度搜索条里打上姚明后会出现很多网站,怎么能只把这些网址采集出来,而不要其他的内容呢?一直测试就是不能成功,麻烦高手告知一下,谢谢。 直接把这个当成内容页来采集即可 你测试一下 就发觉百度挺变态的 新人一枚,测试了好久有了这个方法,希望跟大家分享,少走弯路,大家一起分享,一起学习~~方法是:
1,从网址中采集,2,正则 ((?<content>[\s\S]*?)$ 3,文件下载那里点一下,在右边勾选--探测文件真实地址但不下载
页:
[1]