如何在DMP中合并用户和建立用户gydF4y2Ba

到场的平台gydF4y2Ba,gydF4y2Ba到场的过程gydF4y2Ba

如何在DMP中合并用户和建立用户gydF4y2Ba

发布于2019年9月10日,更新于2021年4月23日gydF4y2Ba,gydF4y2Ba,gydF4y2Ba

几乎每一个gydF4y2Ba数据管理平台(DMP)gydF4y2Ba市场上允许广告商创建受众并将其用于不同的用例,如改进gydF4y2Ba在线广告targetingydF4y2BaggydF4y2Ba和先进的分析。gydF4y2Ba

要在DMP中创建受众,平台必须首先创建用户配置文件,用户配置文件由许多配置文件标识符组成。gydF4y2Ba

作为Clearcode的一个AdTech开发团队最近进行的一个内部项目的一部分,我们研究了受众构建和档案合并的主题,并在下面列出了我们的一些发现。gydF4y2Ba

为了提供一些关于概要文件合并的目标和目的的上下文,我们首先需要解释什么是受众构建,以及什么是概要文件和概要文件标识符。gydF4y2Ba

如何在DMP中建立用户gydF4y2Ba

受众培养是其中之一gydF4y2BaDMP中的主要数据处理。gydF4y2Ba

一旦广告商在DMP中创建了一个受众,他们就可以将其输出到其他系统,比如gydF4y2Ba需求方平台(DSP)gydF4y2Ba,以改善广告定位。gydF4y2Ba

受众是一组共享公共用户标识符的用户配置文件。gydF4y2Ba

例如,广告商可能在其DMP中创建一个名为“来自美国的访问者”的受众。然后,受众将包含具有诸如“country = USA”属性的概要文件。gydF4y2Ba

说明概要文件合并如何在数据管理平台(DMP)中工作的图表gydF4y2Ba
概要文件合并过程在DMP中的样子。gydF4y2Ba

以下是上图的概述:gydF4y2Ba

  • 一个新的事件发生了-在这种情况下,一个网站访问。gydF4y2Ba
  • 该事件包含多个配置文件标识符:gydF4y2Bacookie_idgydF4y2Ba,gydF4y2Ba国家gydF4y2Ba和gydF4y2Baclick_idgydF4y2Ba。gydF4y2Ba
  • 概要文件标识符被标识为属于现有概要文件。任何新的标识符,在本例中为gydF4y2Baclick_idgydF4y2Ba,添加到配置文件中。gydF4y2Ba
  • 概要文件将添加到任何现有的受众,只要它满足条件。在这种情况下,它将被添加到gydF4y2Ba来自美国的游客gydF4y2Ba观众,因为gydF4y2Ba美国国家=gydF4y2Ba属性。gydF4y2Ba

注意:gydF4y2Ba大多数dmp对个人身份信息(PII)进行散列,例如电子邮件地址。为了简单起见,我们将在本文中使用非散列电子邮件地址的示例。gydF4y2Ba

受众是建立在许多处理假设之上的,过程从输入事件(例如web访问)开始,其中可能包含不同的用户标识符。gydF4y2Ba

为了创建概要文件以及随后的受众,每个事件通常需要至少有一个概要标识符。gydF4y2Ba

建立一个DMP吗?gydF4y2Ba

告诉我们你的项目,看看我们能提供什么帮助gydF4y2Ba

建立一个DMP吗?gydF4y2Ba

请填写下面的表格,并了解我们的开发团队可以如何提供帮助gydF4y2Ba



什么是配置文件和配置文件标识符?gydF4y2Ba

配置文件是从DMP跟踪的事件中收集的一组数据。它代表一个用户,可能包含以下信息:gydF4y2Ba

  • profile idgydF4y2Ba
  • 饼干id(列表)gydF4y2Ba
  • 散列邮件(列表)gydF4y2Ba
  • Sid / uuid (list)gydF4y2Ba
  • 国家(以来)gydF4y2Ba
  • 名称(gydF4y2Ba可以为空gydF4y2Ba)gydF4y2Ba
  • device_type(以来)gydF4y2Ba
  • device_vendor(以来)gydF4y2Ba
  • device_os(以来)gydF4y2Ba
  • browser_vendor(以来)gydF4y2Ba
  • 性别(可以为空)gydF4y2Ba
  • 公司(可以为空)gydF4y2Ba
  • 公司规模(可以为空)gydF4y2Ba
  • 匹配id(列表)gydF4y2Ba

上面给出的列表可以通过DMP的特定用例进行扩展。有些字段在开始时没有填充数据。gydF4y2Ba

一般来说,如果一个输入事件包含一个未知的标识符(即一个已经不在DMP中的标识符),一个新的概要文件将被创建。gydF4y2Ba

另一方面,如果输入事件包含DMP已经知道的标识符,则使用来自事件的传入数据更新配置文件。gydF4y2Ba

在使用事件数据更新概要文件之后,两个概要文件通常可以共享一个公共标识符。gydF4y2Ba

如果发生这种情况,DMP将必须执行一个称为概要文件合并的操作。gydF4y2Ba

什么是概要文件合并?gydF4y2Ba

概要文件合并操作确保给定概要文件中没有重复的标识符或属性,并且没有两个概要文件具有相同的惟一标识符(例如电子邮件地址)。它通过将共享一个公共标识符的所有概要文件转换为一个概要文件来实现这一点。gydF4y2Ba

由于事件可以有多个标识符,它们可以来自相同的用户/配置文件,但具有不同的标识符。gydF4y2Ba

例如,考虑以下三个事件:gydF4y2Ba

事件1:gydF4y2Ba用户使用Firefox访问publisher.com:gydF4y2Ba{cookie_id = 7 m-q1p8-6awg-1n3i}gydF4y2Ba

事件2:gydF4y2Ba同一用户在publisher.com上使用Chrome订阅时事通讯:gydF4y2Ba{email = ben.kenobi@example.com, cookie_id =gydF4y2BaeyJraWQiOiJzZXNgydF4y2Ba}gydF4y2Ba

事件3gydF4y2Ba:用户使用Firefox在publisher.com上填写表单:gydF4y2Ba{email = ben.kenobi@example.com, cookie_id = 7M-Q1P8-6AWG-1N3I}gydF4y2Ba

这三个都来自同一个用户,但是在第三个事件到达系统之前,这是未知的,它们被视为两个完全独立的概要文件。gydF4y2Ba

一旦知道这三个配置文件来自同一个人,最好将它们视为同一个对象(配置文件),否则,我们将有多个配置文件分配给一个用户,这些配置文件不会包含最新的和最新的信息。gydF4y2Ba

概要合并至少需要将id和概要属性连接在一起。gydF4y2Ba

由于可以通过事件收集大量的id和属性,因此可以合并并使用收集到的一小部分数据来创建受众。gydF4y2Ba

此外,如果在配置文件之间发现了多个用户标识符,我们需要确定哪个标识符是正确的——即在数据合并后将使用单个ID作为主ID。这个主ID还将用于将来自事件的新数据分配给给定的配置文件。gydF4y2Ba

为了简化操作,假定可以计算主标识符。这意味着,当一个具有多个ID的事件到达系统时,将根据事件ID加上任何其他已知ID计算出一个ID。gydF4y2Ba

一个简单的实现是构造一个包含所有已知ID的列表,对其进行排序,并使用第一个元素作为主ID。此方法是最简单的,但是根据DMP的业务用例而有所不同。gydF4y2Ba

可以将合并的概要文件分配给与其原始概要文件不同的段或受众。gydF4y2Ba

在概要文件合并操作之后,gydF4y2BaDMP分类法gydF4y2Ba,细分市场和用户也需要重新生成。gydF4y2Ba

如何合并配置文件gydF4y2Ba

为了有效地进行配置文件合并操作,必须确定合适的合并方式。gydF4y2Ba

想象一下两个概要文件之间的合并操作,这两个概要文件都包含用户输入的信息,在其中可以找到链接字段。gydF4y2Ba

带有时事通讯订阅表单和一个联系表单的图像。gydF4y2Ba
该用户在两个不同的平台上注册时提供了两个不同的名字。gydF4y2Ba

概要文件合并操作必须决定哪个名称是正确的。gydF4y2Ba

有几种进行概要文件合并的方法。下面,我们列出了四个可能的选项。gydF4y2Ba

按覆盖现有的id和属性排序gydF4y2Ba

合并概要文件最简单的方法之一是用新的传入的id和属性覆盖所有现有的id和属性。gydF4y2Ba

这可以通过定义保持一致的主ID(意味着它不会被更新)或者在每次收集新ID时替换主ID来实现。gydF4y2Ba

按字母顺序排序gydF4y2Ba

字母排序是将不同配置文件合并在一起的另一个简单选择。gydF4y2Ba

使用此方法,概要文件之间的数据将按字母顺序排序,并使用第一个值。gydF4y2Ba

根据我们的例子,我们有两个名字:Ben和Obi-Wan。按照字母排序,本的名字是正确的。gydF4y2Ba

时间戳排序gydF4y2Ba

另一种方法是使用具有第一个或最后一个记录的时间戳的值。gydF4y2Ba

在大多数情况下,时间戳排序将是最希望使用的方法。gydF4y2Ba

同样,根据这个示例,首先接收的是包含名字Ben的事件,所以我们使用它而不是Obi-Wan。gydF4y2Ba

重要的是要注意,时间戳排序是由事件时间决定的,而不是处理时间。gydF4y2Ba

观望的排序gydF4y2Ba

一个更复杂的解决方案是保留所有的值以供参考,直到一个不同的排序方法(例如时间戳)适用,该方法可以确定假设是否正确,并在合并后列出最终的值。gydF4y2Ba

你使用哪个配置文件合并选项?gydF4y2Ba

大多数时候,分配一个配置文件合并算法是基于DMP的用例,但也依赖于我们合并的数据类型,并且在大多数情况下需要业务证明。gydF4y2Ba

要考虑的另一个方面是概要文件合并操作的顺序。gydF4y2Ba

当发现两个带有链接字段的概要文件时,将执行概要文件合并操作。在单个操作期间,可能会出现需要合并两个以上概要文件的情况。gydF4y2Ba

例如,如果有三个概要文件需要合并,那么前两个概要文件将被合并,第三个概要文件将与第一次合并的结果合并。gydF4y2Ba

为了正确地执行这个过程,必须确定合并顺序。gydF4y2Ba

例如,我们可以假设顺序是基于每个事件的时间戳。gydF4y2Ba

考虑到这一点,我们可能会面临这样一种情况:不同的合并操作顺序可能会以不同的最终概要组合结束。gydF4y2Ba

为了保证正确的合并,可能需要一个额外的服务来定期验证概要文件合并,这取决于业务用例。gydF4y2Ba

如何处理并发合并gydF4y2Ba

大多数DMP系统在速度和数据量方面经常面临非常高的处理要求。gydF4y2Ba

并发概要文件合并是一种解决方案,它使我们能够在很短的时间内执行概要文件合并。gydF4y2Ba

然而,在这种情况下,多个流程正在评估事件,合并变得复杂得多。gydF4y2Ba

并发合并的主要问题是,当DMP同时处理多个事件时,如何处理并发合并。gydF4y2Ba

对于首先接收事件的流程,一个简单的方法是创建一个新的概要文件,然后在第二个流程中使用该概要文件。gydF4y2Ba

然而,这与同步会导致各种各样的问题——它通常需要一段时间来创建一个新的概要文件,所以第一个进程结束之前创建一个新的概要文件,第二个过程决定,它还应该创建一个,导致两个配置文件,真的应该合并。gydF4y2Ba

虽然这似乎不太可能发生,但考虑到DMP处理的数据规模,这样的问题无疑会出现。gydF4y2Ba

为了避免这样的问题,我们决定将事件路由到不同的进程,从而产生一个处理所有标识符的主进程。gydF4y2Ba

当一个新的事件到达DMP时,路由器检查它的ID并决定它应该去哪个处理器,哪个处理器(使用一个合适的路由算法)应该允许均匀的负载分配。gydF4y2Ba

这减少了将概要文件并发合并为多个简单合并(如上所述)的问题,而代价是单点连续处理。gydF4y2Ba

即使来自同一个概要文件的两个事件同时到达,但它们具有不同的标识符(因此应该合并),它们也将一个接一个地进行处理,并且都将转到同一个处理器。gydF4y2Ba

为了确保流程顺利运行,每个流程都应该能够访问所有概要文件。如果每个进程都有自己的配置文件存储(例如,数据库),这将需要从一个进程复制配置文件到另一个进程。gydF4y2Ba

关键的外卖gydF4y2Ba

以下是我们从个人资料合并研究中得到的一些关键结论:gydF4y2Ba

  • 概要文件合并算法的正确实现不仅仅是技术实现的问题,还包括DMP和业务用例。gydF4y2Ba
  • 由于配置文件合并的方式多种多样,根据不同的合并操作和收集数据的时间,用户配置文件可能会随着时间的变化而变化。记住dmp在不同的时间收集用户数据是很重要的——有时它可以是实时的(比如从一个网站收集数据),而其他时候可以通过数据导入操作(比如从一个网站收集数据)。gydF4y2Ba新员工培训的第一手数据gydF4y2Ba)。gydF4y2Ba
  • 为了确保用户数据不被虚假信息所污染,我们需要为每个收集和填充的个人资料信息片段提供适当的合并算法。gydF4y2Ba

想要建造一个DMP?gydF4y2Ba

与我们的一个AdTech/MarTech开发团队安排一个电话,以获得初步的成本w88优德官网页和时间估算gydF4y2Ba

获得初始成本和时间估算gydF4y2Ba

免费AdTech & MarTech资源w88优德中文gydF4y2Ba

通过我们的双月刊时事通讯,成千上万的c级高管、软件工程师、营销人员和广告商都可以了解AdTech和MarTech的内部工作原理——你也可以!今天就订阅,获得最新最好的文章、视频和指南!gydF4y2Ba