Excel数据清理

问题描述

我正在寻找清理和整理Excel数据以进行分析和可视化的最佳方法。我需要的是将数据转换为一种属性类型的格式,即一列,每列顶部都有一个标题。您将在下面找到我要实现的目标的示例。之后,我想使用PowerBI创建图形概述。 我可以要求小费吗?

数据表:

第6-7行包含第一个实体,第8-9行包含第二个实体,

Sheet 1

Sheet 1

工作表存在的问题:

  • 每个实体跨越两行
  • 前4行无关,第五行包含标题
  • 每个大约50行有一个分页符,其中包含空单元格

有关如何清除数据的示例:

Sheet 1 cleaned

解决方法

我已经多次解决了这个问题:您从某个旧系统接收数据,该数据经过格式化后可以在面向字符的打印机上打印输出。

当我只需要执行一次时,我会使用公式仔细地对数据进行排序和过滤,以使第二行中的数据一直到第一行中的数据。然后我取消公式,进行排序,过滤和删除,直到获得所需的内容。

当我必须定期执行此操作时,我会在工作表的每一行上编写一个VBA脚本,识别相关的行或数据并将它们复制到其他位置(或删除不相关的行,尽管删除了其中的行)长纸需要很多时间。)

如果您希望它更复杂,则可以将数据读入某种对象结构,并以Excel或XML或任何您喜欢的方式写出该对象。

无论如何,没有简单的解决方案。但是,如果您知道自己的数据,则可以找到识别实体并将它们放在一行中的方法。

当然,最好的方法是与创建输出的人交谈,并要求他或她提供体面的CSV文件。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...