hetaopian 发表于 2012-1-10 09:36:34

火车头能不能方便地采集多表(多实体)的数据库?

即不只是一次采集单一实体的一个表,而是可以先后采集一个网站上的多种有联系的实体,然后建多个表,每个表之间的数据之间由某一个字段联系起来。。大家懂我的意思。我没用过火车头,不知道它能不能方便地做到这一点,还是火车头只能离散地采集单一实体?

比如采集商业黄页,有以下几种实体:

省(id, 省名)
城市(id, 城市名,省id)
公司(id, 公司名,电话,地址,城市id)
父行业(id,名)
子行业(id,父行业id)
公司对子行业(id,公司id,子行业id)

其中每一个实体都成一个表,然后所有表加起来就是一个数据库。

我的问题就是,火车头能不能比较方便地把一个网站(比如这个商业黄页网站)的所有实体立体地采集下来做成一个完整、有机的数据库?

谢谢!

页: [1]
查看完整版本: 火车头能不能方便地采集多表(多实体)的数据库?