一个简单的多页面采集难倒一大片!
很简单。新浪博客中的图片采集一个页面 深度为0
此页面中包含多10个网址,每个网址中有一张图片。我需要这些图片。
本来可以直接得到网址中的大图,但是下载不下来返回错误。
所以只能多页面采集。
请问,多页面采集我能得到10个网址么?
然后再规则然后得到图片么?
因为我发布文档时想要这些图片在一个文档中!但在博客中这些图片是在多个文档。 使用接口处理一下看 好,再学学接口处理吧。
没用过接口。
谢谢! 我用了最傻最笨的一个办法,多篇文章采集结果为html文件,当然只要自己需要的部分,然后再用工具合并并转化为txt文件,就是代码。然后上传图片,然后把代码直接发到文章中即可。
我的娘啊!
太笨了吧!
页:
[1]