boardlayout 发表于 2009-6-4 14:58:31

请问一下:如果怎么样采集当天的信息

URL为:http://health.sohu.com/tansuojiankang.shtml

这个页面里边的文章的URL是:
http://health.sohu.com/20090602/n264288437.shtml
http://health.sohu.com/20090603/n264311688.shtml
http://health.sohu.com/20090604/n264332274.shtml

如果只想采集 URL 里边那个日期为当天的,应该怎么操作啊?

菜鸟一只,请各位帮帮忙~谢谢

zhouchanglin 发表于 2009-6-4 15:05:50

网址必须包含/20090604/

wolf108 发表于 2009-6-4 15:06:06

你先一下把它全部采集了,然后设个定时采集,以后不就能采集当天的了?

boardlayout 发表于 2009-6-4 15:08:46

是不是第一次采集完成之后,以后再继续采集的话,那么应该是只采集到最新发布的URL了吧?

jueshihaogongzi 发表于 2009-6-4 18:42:49

是不是第一次采集完成之后,以后再继续采集的话,那么应该是只采集到最新发布的URL了吧?
boardlayout 发表于 2009-6-4 15:08 http://bbs.locoy.com/images/common/back.gif是这样的
页: [1]
查看完整版本: 请问一下:如果怎么样采集当天的信息