RE: monface
7楼目前这个确实不好做.因为我们不懂这方面的技术.目前用户可以通过插件来实现自己的一些功能.
8楼
绑定硬件确实对有些经常换电脑的朋友不方便.有朋友提出使用狗,此方法有可行性,目前暂时还没列入计划. 1.软件界面. 界面流程上有可能有改进余地,只是有这个感觉,没有深入想。美工可以请个专业的重新设计下美化下。另外曾经有个想法,是否可以开发web版的火车,web版的好处很多,比如官方比较好管理,可以把软件销售模式提升为服务收费模式,对用户而言,可以脱离客户端差异带来的困扰,还可以离线管理,完全自动更新维护等。当然,这个肯定要先核算下开发成本和开发的必要性究竟有多大。这里先提出来共大家集思广益。
2.用户体验.用户体验呢,就是尽可能把技术封装成易用的模块,不需要用户接触里面的东西就能上手使用,另外软件每个步骤上相关的帮助说明也还有完善的余地。
3.bug. 都提交到bug区了
4.新功能. 在多页采集那里,还可以进一步开发下,比如对多页规则的组合和多页的层数,可以进一步加大功能,分页那里也一样。这两部分做好,互联网上几乎没有可以屏蔽火车头的网页了,而且用户不需要整什么php接口之类那么复杂。在内容的原创化方面,希望有更大的灵活度。 不要用狗啊,我的电脑放在公共办公室,别人偷去了狗咋办 1.希望能该进下多次 多页采集并不止是当前的只能一次多页采集 那样限制很大
2.希望对火车头的接口进行处理,就算我用正确的方法写的一个接口还是会抱序列化错误!
3.希望能增加一些更多实用的功能,具体的还没想到哈占位思考中
RE: testu
12楼:1.Web采集器要安装在用户的服务器吗?这个要自动更新不好办.如果提供采集服务是可以的.
3.帮助文档是不完善,有待改进.
4.这一块我们更趋向于插件功能.我们在尽可能多的地方提供插件接口,方便大家的开发. 本帖最后由 连通 于 2009-11-23 18:53 编辑
BUG
开始和结束字符串那也 无法识别 符号"—" .估计整个采集器,哪都识别不了.
http://bbs.locoy.com/spider-44957-1-1.html
2、输入框拖放选择时的问题
http://bbs.locoy.com/spider-43538-1-2.html
3、修改规则标签名 遇到有重名时 错误
http://bbs.locoy.com/spider-44277-1-3.html
4、收费版"探测文件并直接下载"问题."标签"选择了"探测文件并直接下载"功能.但不是每个帖子都包含附件的.当帖子不包含附件时,出现错误识别(把部分内容错误识别为附件下载了),导致内容采集不全.
http://bbs.locoy.com/spider-44931-1-1.html
建议
1、删除该站点地址库 "删除" 改为 "清空"
http://bbs.locoy.com/spider-45037-1-1.html
2、增强 键盘快捷键.操作
http://bbs.locoy.com/spider-44449-1-1.html
3、网站发布配置和发布模块 增加 "分类" 可以通过"分类"筛选.
http://bbs.locoy.com/spider-44084-1-2.html
4、复制任务时 不要另外自建"多页项目".调用原有的就行.
http://bbs.locoy.com/spider-43901-1-2.html
5、任务树问题。每次修改任务名就会自动刷新任务树,站点/任务多了后刷新太慢了.
建议 修改任务名独立出来.修改任务名后不自动刷新任务树.手动刷新.
或想些更高明的方法解决.
http://bbs.locoy.com/spider-43401-1-1.html
6、把采集内容为空的 另外标记
http://bbs.locoy.com/spider-43359-1-1.html
7、清空该任务所有本地采集数据时,可以同时删除相关的附件. 12楼:
1.Web采集器要安装在用户的服务器吗?这个要自动更新不好办.如果提供采集服务是可以的.
3.帮助文档是不完善,有待改进.
4.这一块我们更趋向于插件功能.我们在尽可能多的地方提供插件接口,方便大家的开发.
rq204 发表于 2009-11-23 18:22 http://bbs.locoy.com/images/common/back.gif
感谢回复,第一条我也不太明确,初步的想法是所有的东西都放在火车头服务器上面。就像现在国外有非常火爆的服务,就是用户定期把自己电脑中所有软件包括操作系统备份到官方服务器上,这种服务居然大把的人在用。
如果整个火车就是一个网站,客户上来以后只需要有个用户名和密码,然后采集、预发布所有操作都在网上进行,可能至少是件很有趣的事。当然要求火车的服务器够强大。这个想法有些疯狂,不过也不是不可能呢。 本帖最后由 连通 于 2009-11-23 21:32 编辑
如果整个火车就是一个网站,客户上来以后只需要有个用户名和密码,然后采集、预发布所有操作都在网上进行,
估计收律师信收到手软.{:4_196:} 顶一下 !!!!!!!!!! 分页采集时JS调用的分页代码现在版本不能识别