问题描述
||
我正在为其中一位客户开发数据集市。
我想知道在定义和选择数据集市中的列的数据类型和长度方面是否有最佳实践。我对此有点担心,因为数据将来自多个来源,并且最大长度(根据sql数据探查器)不是另一个最大长度。
提前致谢。
解决方法
我建议使用@picmate ...(我们使用MS SQL Server(因此,我的数据类型示例将来自此处))。
使用整数代理键(如果知道维值的数量,则为small / tiny int)。
言下之意,不要使用自然键加入暗淡/事实。
显然,您将需要选择最长/最大的值作为为其构建架构的值。
不要针对您期望的字段的确切容差进行构建。例如如果企业告诉您产品代码是CHAR(10)并且永远不会更改,请确保添加一些额外的字符,因为总会有一些未被考虑的异常(例如企业合并!)。因此,请选择VARCHAR(255)而不是CHAR(10)。开销仅是变量长度的+2个字节
使用任何具有存储优势的本机数据类型(SMALLDATETIME,TIME)