今天看Nicholas的blog,看到了一篇使用Mysql做数据仓库事实表的文章,深受鼓舞。Mysql已经足以用来构建大型数据仓库了。 在这篇文章里,Nicholas举了他的一个客户的例子。该客户使用Mysql作为数据仓库,每天有2亿条新增数据,可以说是海量数据。由于客户预算有限,所以希望Nicholas帮助解决数据存储空间占用过大的问题。
Nicholas通过一个比较案例,提出了使用MySQL的Archive表类型的解决方案。
Nicholas的原文blog链接:http://www.nicholasgoodman.com/bt/blog/2007/04/18/mysql-archive-tablespace-for-facts/
案例相关的Kettle转换文件和mysql脚本下载:
http://qinhui99.itpub.net/resource/2570/23302
http://qinhui99.itpub.net/resource/2570/23303
大家自己可以做个测试,比较一下,看看Archive表类型的威力。
[@more@]