尽管数据很小,但字符串列的 Power BI 字典大小超过 1mb

问题描述

我今天遇到了一个不寻常的情况,包括新创建的 Power BI 文件和以前可以正常工作的现有文件

导入 string 数据时,无论导入什么数据,列的字典大小都超过了兆字节。对于具有大量列的任何小表,这显然会导致模型大小显着膨胀。

此问题发生在从 sql Server、Synapse、Data Lake Gen2 和本地文件存储导入的数据中。

效果可以在下面所有 Col Size 列的 string 值中看到,以及它们与 Cardinality 中的差异没有相似之处。因此,导入单个 1,206Kb csv 文件会导致模型大小为 38.15Mb。

有没有其他人遇到过这个问题或知道如何纠正?我能想到的唯一改变(除了一个小的背景更新)是升级到新的模型视图,虽然我大约一周前这样做了,但今天才出现......


加载了一个小 csv 的新模型的 VertiPaq Analyzer 指标:

enter image description here

Power BI 详细信息:

Release:
December 2020

Product Version:
2.88.1144.0 (20.12) (x64)

OS Version:
Microsoft Windows NT 10.0.18363.0 (x64 en-GB)

CLR Version:
4.7 or later [Release Number = 528040]

Model Default Mode:
Import

Model Version:
PowerBI_V3

Is Report V3 Models Enabled:
True

Enabled Preview Features:
PBI_NewWebTableInference
PBI_v3ModelsPreview

disabled Preview Features:
PBI_shapeMapVisualEnabled
PBI_SpanishLinguisticsEnabled
PBI_JsonTableInference
PBI_ImportTextByExample
PBI_ExcelTableInference
PBI_qnaLiveConnect
PBI_eiminformationProtectionForDesktop
PBI_azureMapVisual
PBI_dataPointLassoSelect
PBI_compositeModelsOverAS
PBI_narrativeTextBox
PBI_dynamicParameters
PBI_anomalyDetection
PBI_newFieldList
PBI_cartesianMultiplesAuthoring

disabled DirectQuery Options:
TreatHanaAsRelationalSource

解决方法

所以事实证明,这个问题是我自己造成的,因为没有让 DAXStudio 保持最新状态。

安装最新版本的 DAXStudio 显示出更合理的 Dictionary 尺寸和更小的整体模型尺寸。

嗯,还有更糟糕的方式来度过几个小时......