由于工作模式循环采集顺序储存错误问题。先保存每一页第一个标题。后保存其他标题
比如一个网址10页,每一页20个标题我想按顺序保存这些标题。用单页循环方式采集。
导出EXCEL,
由于火车头先采集网址,后采集内容的工作原理。
导致这个数据上这样存储的。先把每一页第一个存储之后,再存储了其他的信息。
能不能删除前面10个?让顺序一致?
如果碰到循环采集,先把第一个删除,再去存储。 此贴可以关闭。忘记了。几个月前 火车头开发这个工作模式,忘了忘了,一时间忘了用。 其他方法我也有,还是希望火车头能增加工作模式。 火车头开发到现在,没有考虑到数据严谨性。质量高的时候。采集数据,导出数据是有顺序性的,这方面有待提高。比如我采集出来的东西怎么能跟对方一样的顺序,发布也是。
2个问题,一楼的循环排序。发布报错停止按钮。如果有报错自动停止。软件是不是就不会一直傻瓜式的提交数据了,更加智能一些。对数据顺序也有好处。
页:
[1]