the17sheep 发表于 2011-5-21 15:00:23

火车我研究也半天,觉得这个如果要大量采在线阅读是不可能的!

一般在线小说的结构是这样的

小说书名列表页   该书名的信息页   阅读章节目录页   章节内容页
      |            |                  |            |
这需要采网址       这需要采内容   这采章节网址       这才是最后的内容
                     和一条目录页
                     的网址   



说白了这个采集的深度是不是已经超出来火的采集深度,而我发现很多小说站的后台都有想应的追溯采集,能很好的解决这个问题。
我想咱们的火车是不是也应该考虑下这个方面的耍求。也可能有我没有发现,如果有,也请高手指点一下。不然,采在线的要么就一本一本的采。
要么就要先采到书名信息页,再采各个章节的内容
页: [1]
查看完整版本: 火车我研究也半天,觉得这个如果要大量采在线阅读是不可能的!