各位高手, 请问一个网址包含日期的网页, 内容怎么采集?
最近遇到一个很棘手的问题, 就是要采集的网址中包含日期, 日期每天都是变化的, 网址的其他部分不变, 这种网址的内容该怎么采集? 比如人民日报网站上的http://paper.people.com.cn/rmrb/html/2009-10/16/node_1922.htm, 谢谢了! 不明白楼主的意思 看看这个网址,http://paper.people.com.cn/rmrb/html/2009-10/16/node_1922.htm
其中的/2009-10/16表示的是2009年10月16日;
如果是2009年10月17日网址就变成
http://paper.people.com.cn/rmrb/html/2009-10/17/node_1922.htm
以次类推, 这样的网址怎么采集? 这样说明白了吗? 高手们, 请帮一下忙吧, 谢谢!
页:
[1]