到场的行业,到场的过程,数据和隐私

关于网络隐私的真相:你的数据是如何被收集、共享和出售的

2015年9月7日发布,2020年11月27日更新

在互联网出现之前,广告商和营销人员通过在一天中的特定时段在电视上展示广告、在受众阅读的报纸上发布广告、在受众能看到广告的地方张贴广告牌来锁定目标受众。

如今,广告商和营销人员可以利用网络世界,获取大量用户数据,帮助他们在正确的时间将信息呈现在正确的人面前。

这些用户数据是一笔大生意。

根据Forrester Research,美国公司每年花费超过20亿美元才能挖掘消费者数据。

现在在线用户被追踪的次数比以往任何时候都多,而在线展示广告行业看到了大量的用户数据转化为美元:

在线展示广告收入

但是这么多的用户数据对用户和业务有什么影响呢?

如何收集、共享和交易您的数据

大多数中间互联网用户都知道他们正在通过cookie跟踪他们的在线活动,并用于广告和营销目的 - 但这就是他们所知道的。这些人中的大多数人不知道他们收集了多少在线数据,并流经在线广告生态系统。

这是一个涉及脚本和技术平台的过程,它几乎发生在互联网上的每一个页面上。

虽然所有在线广告行业的公司都收集数据,但也有一些公司以收集和销售在线消费者数据为业务。这些公司被称为数据代理(有时被称为数据代理或供应商)。

免费指南:了解一个成功的广告技术/MarTech项目的关键要素

从识别哪些功能将带来最大价值到发现如何更快发布你的Ad Tech/MarTech平台……

免费下载指南

什么是数据代理?

数据代理汇总从发布者获得的用户配置文件,合并并细分它们。附加的用户信息可以按需提供给程序化广告购买平台。

数据经纪商提供的信息包括:

  • 用户segmentsAd可视性
  • 广告可视性
  • 广告欺诈检测
  • 出版商的上下文信息

我们写了关于数据经纪人是什么以及它们如何运作我们之前的一个帖子

第三方数据代理如何收集在线消费者数据?

脚本

这个过程在用户访问一个网站时就开始了,比如TechCrunch,网站开始加载内容、图片、视频和其他页面元素。在加载所有可见元素的同时,该站点也在加载被称为脚本(通常称为像素)的隐藏项。

所有网站都是使用一方脚本构建的,以在网页上呈现不同的视觉元素;但是,使用第三方脚本也不罕见。有什么不同?本醋,他是《第三方脚本他说得很好:

“严格来说,任何由非网站提供商的机构提供给客户的服务都被认为是第三方。”

有几种类型的第三方脚本,它们都负责执行不同的行动:

广告:用于在网页上显示广告(例如横幅广告)。
跟踪和分析:用于网络分析优德88备用网谷歌Analytics和Piwik职业
社交媒体:用于社交小部件,例如社交共享按钮和像按钮。
字体:用于在不同的浏览器上显示不同的字体。

社交分享按钮
像这样的社交共享按钮是第三方脚本的例子。

在所有的第三方脚本中,广告和分析脚本是最常见的。

使用第三方脚本的站点百分比
图片来源:第三方足迹-出版商对控制第三方脚本的看法,SlideShare演示,Barbara Bermes, 2014年5月。

有些脚本只执行它们自己的动作,而其他脚本使用一种称为盗用,这涉及到在主第三方脚本之上加载其他第三方脚本;例如,一个社交媒体小部件可以加载它自己的脚本,加上其他脚本和网络跟踪器。

除了上述几点,第三方脚本也会严重影响网站的性能,以至于应用和扩展现在允许用户阻止这些脚本的加载,从而提高性能和减少页面加载时间。

一个典型的例子就是即将发布的iOS 9。这是有史以来第一次,更新带来了一个新功能,用户可以下载一个应用程序来屏蔽追踪器、广告和其他不想要的内容。

对于桌面设备,有一个非常棒的工具可以显示第三方脚本的范围及其属性3 d倾斜。这是一个Firefox插件,提供了一个网站不同层的图形概述,包括广告等元素。

上面的截图显示了两个图片广告包含多少层。这些层包括广告元素,它们对网站的加载时间和性能有很大的影响。

收集和共享数据

一些第三方网站纯粹在那里执行他们的预期行动(例如,显示社交按钮),但其中一些用于收集有关网站和用户的数据。这些第三方脚本是两个名字所知的 -追踪器web bug。

追踪器通常由从事数据收集和销售业务的公司(数据供应商)运营。

当用户访问包含跟踪器的网站时,收集有关网站和用户的信息,例如:

有关网站的资料

  • URL
  • 页面标题
  • 分类法(网站的类别)
  • 关于显示的文章或产品的元数据

有关用户的信息

  • Web浏览器
  • 启用插件
  • 屏幕分辨率
  • 浏览器语言
  • 网络历史记录
  • 地理位置
  • 配置文件数据
  • 在线交易历史(例如购买的物品)

需要注意的是,数据也可以直接在数据中间商和公司之间共享,这将导致数据中间商接收到不同的用户数据集,而这些数据集无法通过网络追踪器获得,比如人口统计信息,如收入、性别、年龄等。

追踪器还会搜索他们的第三方的饼干如果他们无法找到它,跟踪器将生成一个UUID (全局惟一标识符),并将其保存为第三方cookie在他们的域-例如tracker.examplesite.com。

这个第三方cookie将帮助跟踪器识别在未来加载跟踪器的任何网站上的用户。

跨不同网站的跟踪器
上图说明了追踪器如何识别不同网站的用户。

一旦追踪者创建了第三方cookie,它就可以将cookie与在线显示广告生态系统中的其他公司同步,比如数据管理平台(dmp),使cookie“激活”,并允许它们开始使用收集到的数据。

销售数据

一旦数据供应商(运行追踪器的公司)收集了这些数据,他们通常会通过以下两种方式之一将其出售给数据中间商(例如dmp):

通过收入分成模式:中间商将数据出售给生态系统中的其他中间商(如dsp、广告交易所、广告网络等),并将收入分成给供应商。

这种支付方式的主要问题是,数据供应商无法知道数据何时出售,以及以多少价格出售。这只是缺乏透明度损害在线展示广告的又一个例子。

通过cookie CPM基础:经纪人销售数据的费用(每千元)的成本为基础,这意味着供应商为他们的网站创建的每一个1,000个独特的饼干支付固定金额(例如30美分)。

数据代理获取购买的数据,处理它,然后创建数以千计的桶(段),包括:

  • 关系状态-例如在一段关系中
  • 兴趣爱好——例如园艺
  • 种族,例如美国原住民
  • 年龄组别-例如35-39岁
  • 性别:例如男性
  • 连接的设备 - 例如Xbox 360.
  • 房屋价值-例如20万至40万美元之间
  • 年收入-例如在6万到9万美元之间

然后,广告商可以结合多个细分市场,直接针对他们想要通过在线广告活动达到的受众。

下面是一个例子:

广告定位段

尽管这些细分市场有助于广告商定位他们的目标受众,但他们也面临一些问题:

问题1:用户数据不正确

Generally, there is no way to tell how old the data is, and although some of the attributes don’t change often – gender, for instance – some may change every few months or even every few days (e.g. buying intents – if I decided to buy a sofa, I’m probably going to do that within next two weeks).

消费者属性的这种变化可能严重影响广告商的广告系列的性能,因为即使他们针对所需的受众,向用户显示的广告可能完全无关紧要。

问题2:将收入归给合适的供应商

它对于从多个数据源创建的段中出现的段中出现的简档是非常常见的,并且可以从数百个供应商的数据创建单个段。因此,当销售数据时,收入(经纪人的委员会之后)需要适当地归因于数据供应商和/或出版商以与其贡献成比例。

不幸的是,在如何做到这一点上没有透明度,归因过程也无法核实。更糟糕的是,目前问题比解决办法还多:

  • 数据代理(买家)是否应该对数据的新颖性给予更高的权重?
  • 是否应该考虑数据的质量?
  • 是否应该考虑这些信息的数量,并对其进行不同的定价?
  • 供应商和代理如何解决来自多个供应商的相同数据的冲突?

事实是对这个问题没有简单的解决方案。

向其他方出售数据

除了直接向广告商出售数据外,中间商还可以通过其他技术平台向广告商出售数据,如需求方平台(DSP)、广告交易所、广告网络、供应方平台(SSP)等。当数据通过技术平台出售时,它将基于CPM进行销售,并根据所购买的库存(广告印象)进行计费。

这意味着,在针对数据代理的广告活动中,每通过DSP购买1000次广告印象,广告商将在购买的库存基础上额外收取1美元的CPM费用。

同样,这种购买方式也存在一些问题。

问题1:缺乏透明度

这种通过技术平台销售的方法的主要问题是它非常不透明。通常,是DSP向DMP报告实时投标(RTB)过程中使用了多少数据,这使得DMP很难确认使用了多少数据。

原因是在RTB拍卖模型中,数据通常在发送到DSP的每个投标请求中提供。DSP方面的投标人代表广告商发送投标,但没有办法知道投标人是否在交易期间使用了数据。

问题2:静态定价

此模型的另一个问题是数据的价格通常是静态的。唯一的区别是一些段被认为是溢价或比其他部分更高,并且康复价格更高。There is no way to dynamically set the price for the data based on the demand and/or quality, and therefore, all the parties in the ecosystem (e.g. publishers, data suppliers, data brokers, advertisers, etc.) may be losing out financially.

数据收集和交易系统概述

通过在线展示广告生态系统的用户数据流是由displayadtech.com。

如您所见,供应商收集的数据被传递给DMP,然后DMP连接到许多其他技术平台。

值得注意的是,只要映射它们的cookie,就可以重新包装并从一个DMP转换到另一个DMP的数据。

到目前为止,cookie是追踪用户在桌面设备上在线活动的最好和最流行的方法。因此,大多数希望保持匿名(或至少限制在线追踪他们的公司数量)的用户删除和阻止第三方cookie也就不足为奇了。然而,仅仅因为用户从浏览器中删除了cookie,并不意味着它们永远消失了。

Cookie Respawing是一个过程,在删除后,饼干重新出现或重生。它通过使用存储在附加文件中的备份数据来实现这一点,然后在用户再次访问该站点时稍后重新抢断。

这个过程是这样的:

  • 用户访问网站。
  • 网站创建一个cookie。
  • cookie为用户的浏览器标记了一个不容易删除的唯一标识符。
  • 用户离开网站并删除他们的cookie。
  • 用户再次访问该网站,(新的)cookie识别浏览器中的标识符,并重新生成原始cookie。

目前,有两种重新击败Cookie的主要方法:

Flash cookie:浏览器插件Adobe Flash Player用于在其计算机上存储有关用户的信息。大多数用户不知道flash cookie,只能通过Adobe flash Player设置来删除它们。

HTML5:HTML5本地存储和缓存cookie通过识别JavaScript和Flash创建的持久标识元素(PIE)来使用实体标记(ETags)来重新生成HTML cookie。

谁跟踪你?

从用户的角度来看,思想流过网络的在线数据通常足以使最开放的人感到偏执。此外,随着第三方脚本和捎带的增加,它可能很难确定哪些公司正在跟踪用户,特别是由于此信息并不容易从网站到现场的方式查找和更改。

然而,有一些非常好的工具可以帮助人们确定谁在跟踪他们的在线活动。

Ghostery

Ghostery是一个浏览器插件,可用于Firefox、Chrome、Safari、Internet Explorer和Opera,以及移动设备(Android、iOS、Firefox Android)。

安装后,一个小的幽灵图像和旁边的数字将出现在浏览器工具栏的右上角。这个数字表示当前在网页上跟踪你的追踪器。

单击Ghost图标将显示在该特定页面上运行的跟踪器的名称和类型。

以下是TechCrunch主页上显示的跟踪器的数量和列表:

ghostery追踪
上图显示,Ghostery在那个特定时间在TechCrunch上发现了19个追踪器。跟踪器的数量因站点和页面的不同而不同。

大多数追踪器用户可能完全不知道,但也有一些是众所周知的,比如Facebook和DoubleClick(谷歌的DSP),它们可能会出现在大多数网站上。

LightBeam

LightBeam是另一个很棒的Firefox浏览器插件,它可以让你发现有多少追踪器在跟踪你的在线活动。

一旦安装,LightBeam将显示你访问一个网站时发送了多少跟踪请求。

仅访问两个热门新闻网站(nytimes.com和techcrunch.com),就会收到110个向第三方服务的请求,其中7个都来自这两个网站。优德88备用网你可以在下面的截图中看到它是如何被LightBeam可视化的:

lightbeam

数据收集的不同观点

对于用户数据的收集、共享和在线销售方式,有许多不同的观点和意见。

一些人认为,如果追踪仅仅是为了广告目的,那么对他们的隐私不会造成很大的风险,而其他人则认为,这显然是对他们隐私的侵犯,会想方设法阻止公司跟踪他们的在线活动。

网络隐私是一个热门话题,特别是自2013年美国国家安全局(NSA)丑闻爆发以来,随着越来越多的用户上网,公司用广告瞄准他们的机会只会增加。

但是,无论您对数据收集的视图如何,它是在线显示广告的领域,克服了许多挑战 - 既来自业务侧和用户侧。

有关于GDPR的问题吗?

我们专注于建设符合gdp的AdTech和MarTech平台。今天问我们的团队一个问题!

回答你的问题

标记下

免费AdTech & MarTech资源w88优德中文

通过我们的双月刊时事通讯,成千上万的c级高管、软件工程师、营销人员和广告商都可以了解AdTech和MarTech的内部工作原理——你也可以!今天就订阅,获得最新最好的文章、视频和指南!