hktk0000 发表于 2015-10-16 16:57:21

新浪新闻采集,

火车头采集问题,采集到这个,接下来要怎么提取页面里面的网址?
http://roll.news.sina.com.cn/interface/rollnews_ch_out_interface.php?col=89&spec=&type=&ch=01&k=&offset_page=0&offset_num=0&num=60&asc=&page=1&r=0.46109949907658204里面的网址该如何提取出来?

303718 发表于 2015-10-17 08:15:24

教程:http://faq.locoy.com/q-800.html

hktk0000 发表于 2015-10-19 10:28:37

列表页的网站链接各不相同,实在不知道怎么采集,能不能给个规则

老雷 发表于 2015-10-25 01:37:42

http://i11.tietuku.com/54c16ab5082f8337.png

链接中,共同的: sina.com.cn或者 用 sina. 都可以。 都能提取出,最终的文章链接。

hktk0000 发表于 2015-10-27 14:50:27

老雷 发表于 2015-10-25 01:37
链接中,共同的: sina.com.cn或者 用 sina. 都可以。 都能提取出,最终的文章链接。 ...

谢谢,晚上试试

s8643161 发表于 2015-10-27 14:55:17

看的不懂啊啊


www.58xxmm.com
页: [1]
查看完整版本: 新浪新闻采集,