另外,如果有个SQL语句自定义就好了并同时导出insert into的sql文件 ,那样RMB也没有问题
一个3.1的严重问题
3.1的内容规则里 开始字符串为何 经常显示空白,一空白,测试就没东西,是不是BUG?里面有代码,但它却显示空白,为何???完全从网页抓的,没有什么特别的,如多个<br>它就不显示了
这样的话会让规则不够准确. 希望内置方法可以将时间转化成时间戳。这样便于直接写库 没有意见,已经完美了 有些建议,兄弟们都提了不少,总结下:
①增强全局定义功能,因为有不少的站,每一次采集前都要进行全局定义,非常不爽!干脆复制了几个火车安装目录,呵呵,也不失为解决的办法。
②论坛发贴登录有时cookie失效,发贴失败,这个方面要改进一下。
③论坛要能用不同的ID随机发贴,最好提供ID批量注册功能。否则同一ID发的论坛一看就是采集来的。
④采集与发布分开为好。当然采集的同时也可以同步进行发布。发布的数据可以提前预览修改和编码转换,支持更多的编码格式。可以有本地采集后的数据库进行在线发布,不同的ID。
⑤有个贴探小黑的软件在发布方面做的非常不错的,可以借鉴下。
⑥3.1的程序可能有些问题,有时明明采集内容和标题了,在发布的时候显示没有标题或内容,不知道是哪儿的问题。
⑦稳定性要加强,我经常有假死的现象,只能在任务中中止。
⑧可以考虑收费或规则收费。 除了4月30开的这个主题,没发现有什么进度嘛,7月1日之前会不会发布?感觉没什么动静。 等 等!期待!盼望!渴望! 迫不急待。 希望能在列表页加入内容排除,过滤掉网页其中的某些代码 .有的网站为了防采集,在采集区域内加入了cms系统代码,这种代码不是网址,但是采集时却出现了。
而且加入列表内容排除,非常有利于规则的制定。。。。
[ 本帖最后由 gototo 于 2007-6-12 20:37 编辑 ]