请问这类国外网站(网页格式为网址+目录)如何采集?
请问这类国外网站(网页格式为网址+目录)如何采集?网页格式为:网址+目录,看不出是HTML还是其它什么静态页面?火车头好象无法识别页面
http://www.menshealth.co.uk/healthy/ 是html页面,可以采集 能具体说说吗?如何看出是html页面?文章内容页面必须包含的地址如何设置? 列表页面地址:http://www.menshealth.co.uk/healthy/
文章页面地址:http://www.menshealth.co.uk/healthy/symptoms-treatment/A-sight-for-strong-eyes
http://www.menshealth.co.uk/healthy/symptoms-treatment/how-to-live-to-100
http://www.menshealth.co.uk/healthy/symptoms-treatment/4-ways-to-get-lean
------------------------------------------------------------
文章页面地址全部为网址+目录+文章题目,没有哪位兄弟试过采集吗?试过的兄弟回个贴啊
页:
[1]