|
昨天建了一条任务测试一下locoyspder,数据库改为MySQL,现发现以下问题,望改正及参考。
1、数据库字段是根据标签名称定义的,也就是标签名是中文,数据库字段名也是中文。能否在新增标签时增加自行更改数据库字段及类型长度的选项,这样有助于提高数据库的性能和效率。
2、在标签的自定义固定格式的数据中,我选择了系统时间(格式:系统时间戳 unix_timestamp()),正常来说这个字段类型使用int(10),但查看了数据库发现是mediumtext类型,所以能否自动判断选择了什么类型的数据就自动设置字段类型或手工让用户自己选择,而不是统一使用mediumtext。当数据量大的时候,统一使用mediumtext的话性能会大打折扣。
3、执行任务时,因为locoyspider一开始是采集网址,而表结构却是这样的,
CREATE TABLE `data_content_7` (
`ID` int(10) NOT NULL AUTO_INCREMENT,
`已采` tinyint(1) DEFAULT '0',
`已发` tinyint(1) DEFAULT '0',
`户型` varchar(333) CHARACTER SET utf8 DEFAULT NULL,
`详细信息` mediumtext CHARACTER SET utf8 NOT NULL,
`电 话` mediumtext CHARACTER SET utf8 NOT NULL,
`标题` mediumtext CHARACTER SET utf8 NOT NULL,
`面积` mediumtext CHARACTER SET utf8 NOT NULL,
`缩略图` varchar(1000) CHARACTER SET utf8 NOT NULL,
`PageUrl` varchar(1000) CHARACTER SET utf8 NOT NULL,
PRIMARY KEY (`ID`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
因为采集网址时只插入PageUrl,而其他非空的字段没有默认值,这时就会导致写入采集网址数据出错。
3、新建数据库及表时,希望将字符集更改为utf8,而不是现在的latin1。
4、locoyspider 插入更新数据时SQL不知道有没有使用参数,有没有使用事务?
谢谢! |
|