发现一个极难采集的站,源代码没内容,高手进来看一下
网址是http://blog.cersp.com/index/1002876.jspx?articleId=7946406这个站找不到任何的可以采集的代码,源代码里根本就没有内容,高手帮忙看一下!说下采集的思路 源地址:http://blog.cersp.com/index/1002876.jspx?articleId=7953841
真实地址:http://blog.cersp.com/index/article/view/7953841.jspx?blogUserId=1002876
有内容的地址是这样的,采列表的时候用正则获取ID组合出网址就可以了
页:
[1]