自从数字广告和营销开始以来,数据一直在创造和优化活动中扮演着关键角色。
虽然dmp和cdp等数据平台提供了许多数据管理功能,但在技术堆栈中添加数据湖可以为您提供更多的业务优势。
看看我们下面的信息图,找出构成数据湖的组件:

什么是数据湖?
数据湖是一个集中式存储库,允许公司存储大量来自各种来源的结构化和非结构化数据。
虽然这听起来可能与关系数据库和数据仓库等其他数据平台类似,但关键的区别在于,数据湖可以以各种格式存储数据,比如CSV、日志文件、音频和视频文件以及文档。
关系数据库和数据仓库只能以给定的模式/格式(例如CSV)存储数据,这使得数据湖对于以不同格式收集不同类型数据的公司非常有用。
在数据湖中收集的数据可以进行转换和分析,也可以传递给其他系统,如数据管理平台(dmp)和cdp。
数据湖的关键功能是什么?
安全:限制和授予来自一个地方的特定人员访问权限。
分析:运行实时分析和报告,并将机器学习模型应用于数据,以预测可能的结果和预测未来的行动。
目录和索引:它通过编目和索引提供易于理解的内容。
分区:适当的分区可以加速并降低数据检索和分析的成本。
AdTech和MarTech的数据湖用例
集中式数据存储:像dmp、CDPs、数据仓库和关系数据库这样的数据系统只允许您以给定的格式存储数据,例如CSV。使用数据湖,您可以以不同的格式存储许多不同类型的数据,例如CSV、日志文件和文档。这不仅允许您为所有数据拥有一个真正集中的位置,而且还可以以较低的成本存储更多的数据。
实时、先进的分析:将所有数据集中在一个地方,可以通过结构化流(可用Amazon Glue)和查询表(例如使用Amazon Athena)运行实时分析。您还可以对数据湖中的数据应用机器学习算法,以运行高级分析。
类似的建模:您可以使用数据湖中的数据来创建相似的模型。虽然您可以在dmp和cdp中创建相似的模型,但通过数据湖创建它们将为您提供更多的数据。
归因建模:与其他数据平台相比,使用存储在数据湖中的数据创建归因模型允许您分析来自更多来源的数据。
配置文件创建:使用数据湖,您不仅可以创建比使用其他数据平台更多的用户配置文件,还可以用更多的数据丰富这些配置文件。