新浪新闻采集,
火车头采集问题,采集到这个,接下来要怎么提取页面里面的网址?http://roll.news.sina.com.cn/interface/rollnews_ch_out_interface.php?col=89&spec=&type=&ch=01&k=&offset_page=0&offset_num=0&num=60&asc=&page=1&r=0.46109949907658204里面的网址该如何提取出来?
教程:http://faq.locoy.com/q-800.html 列表页的网站链接各不相同,实在不知道怎么采集,能不能给个规则 http://i11.tietuku.com/54c16ab5082f8337.png
链接中,共同的: sina.com.cn或者 用 sina. 都可以。 都能提取出,最终的文章链接。 老雷 发表于 2015-10-25 01:37
链接中,共同的: sina.com.cn或者 用 sina. 都可以。 都能提取出,最终的文章链接。 ...
谢谢,晚上试试 看的不懂啊啊
www.58xxmm.com
页:
[1]