Share this article:
1 min read

停止在 Datawrapper 中处理混乱的数据

任何数据分析工作流程中最大的瓶颈通常是数据清理步骤。您可以拥有最先进的可视化工具,但如果您的数据是脏的,您的仪表板就会损坏,您的见解也会产生误导。

对于 Datawrapper 的用户来说,数据清理的斗争实在是太现实了。无论是上传步骤中的手动电子表格编辑,还是只是令人头疼的杂乱文件,释放可视化全部潜力的关键是在数据到达Datawrapper之前*清理数据。

最常见的数据难题:日期列

日期列是数据分析师最常见的头痛来源。您将数据集导入 Datawrapper,突然您的时间序列图表被破坏,因为:

  • 某些日期为“DD/MM/YYYY”(欧洲风格)。
  • 其他为“MM-DD-YYYY”(美国风格)。
  • 有些只是文本字符串,例如“Jan 12, 2024”。

尝试在 Datawrapper 中修复此问题是一场噩梦。您最终会编写复杂的解析函数、创建严格的公式或在 Excel 中手动编辑单元格。它容易出错且乏味。

我们的理念:“接受一切,输出一个”

Datastripes 实际应用

在数据清理方面,尤其是时间戳,Datastripes 采用了完全不同的方法。 我们相信“接受一切,输出一个。”,这意味着 Datastripes 使用智能摄取引擎,自动接受混合格式,而不是要求您编写代码来定义日期格式。

  1. 首先,删除原始 CSV。 Datastripes 会检测日期列,即使它包含混合在一起的 5 种不同格式。
  2. 然后,系统自动将所有内容转换为单一的通用标准 (ISO 8601)。
  3. 最后,您立即看到时间线分布。如果存在异常值(例如 2099 年的日期),您可以直观地发现它们并通过单击将其过滤掉。 您不必担心日期如何书写。您只知道输出的是一个干净的、可排序的时间戳。

超越日期的可视化数据清理

Datastripes 的强大功能不仅仅限于清洁日期。通过在将数据发送到 Datawrapper 之前使用可视节点流,您可以:

  • **使用直方图直观地过滤异常值。
  • 通过简单的界面对类别进行分组(例如,将“USA”、“U.S.”和“US”变成“United States”)。
  • 基于 ID 删除重复行,无需编写 SQL。

现在轮到你了

在几分钟内开始直观地清理数据,然后将其导出以供 Datawrapper 使用。 免费试用 Datastripes 并首次清晰地查看您的数据。

Welcome to Datastripes

Be one of the first early-birds! Join the early access