ffn8820 发表于 2010-8-23 23:39:01

请问这类国外网站(网页格式为网址+目录)如何采集?

请问这类国外网站(网页格式为网址+目录)如何采集?
网页格式为:网址+目录,看不出是HTML还是其它什么静态页面?火车头好象无法识别页面
http://www.menshealth.co.uk/healthy/

wxl08 发表于 2010-8-24 11:48:14

是html页面,可以采集

ffn8820 发表于 2010-8-24 21:00:56

能具体说说吗?如何看出是html页面?文章内容页面必须包含的地址如何设置?

ffn8820 发表于 2010-8-26 21:10:01

列表页面地址:http://www.menshealth.co.uk/healthy/
文章页面地址:http://www.menshealth.co.uk/healthy/symptoms-treatment/A-sight-for-strong-eyes
http://www.menshealth.co.uk/healthy/symptoms-treatment/how-to-live-to-100
http://www.menshealth.co.uk/healthy/symptoms-treatment/4-ways-to-get-lean
------------------------------------------------------------
文章页面地址全部为网址+目录+文章题目,没有哪位兄弟试过采集吗?试过的兄弟回个贴啊
页: [1]
查看完整版本: 请问这类国外网站(网页格式为网址+目录)如何采集?