knifeqiao 发表于 2016-12-26 16:35:36

如何采集列表页里的网址?

首先谢谢指教

列表页:http://域名/news/
新闻1列表:http://域名/news/1/
新闻2列表:http://域名/news/2/
所有的新闻都是:http://域名/news/(*).html


例如想单独采集新闻2下面的网址,该如何操作。火车头能像采集侠那样抓取列表页里面的网址么?

leweizxl 发表于 2016-12-26 16:53:34

有范围吧设置下采集范围

knifeqiao 发表于 2016-12-27 08:17:17

leweizxl 发表于 2016-12-26 16:53
有范围吧设置下采集范围

http://域名/news/(*).html所有列表共用的排序,没法明确范围。想要实现抓取指定页面内的所有链接这样的效果,不知道有办法实现么?{:3_157:}

leweizxl 发表于 2016-12-27 09:18:35

网址里有网址过滤 有统一字符的话可以设置
页: [1]
查看完整版本: 如何采集列表页里的网址?