火车我研究也半天,觉得这个如果要大量采在线阅读是不可能的!
一般在线小说的结构是这样的小说书名列表页 该书名的信息页 阅读章节目录页 章节内容页
| | | |
这需要采网址 这需要采内容 这采章节网址 这才是最后的内容
和一条目录页
的网址
说白了这个采集的深度是不是已经超出来火的采集深度,而我发现很多小说站的后台都有想应的追溯采集,能很好的解决这个问题。
我想咱们的火车是不是也应该考虑下这个方面的耍求。也可能有我没有发现,如果有,也请高手指点一下。不然,采在线的要么就一本一本的采。
要么就要先采到书名信息页,再采各个章节的内容
页:
[1]