跳至主要内容

Twilio Segment 客户数据平台:企业综合指南

本技术指南介绍了如何实施 Twilio Segment 客户数据平台 (CDP) 来统一碎片化的数据源。它为 IT 和营销团队提供了可操作的架构蓝图和部署策略,以激活第一方数据。

📖 5 分钟阅读📝 1,171 🔧 2 应用实例3 练习题📚 8 关键定义

收听本指南

查看播客转录
你是一位高级技术顾问,操着冷静、权威的英国口音,在私人会议室里向客户做汇报。说话要带着沉稳的自信,节奏适中,偶尔展露冷幽默。这不是讲课,而是同行之间的交流。口齿清晰,段落之间有自然停顿: 欢迎参加关于 Twilio Segment 客户数据平台的简报会。我将带您了解它是什么、它的底层工作原理、如何部署它,以及最关键的是,像贵公司这样的企业在哪些方面能从中获得真正的价值。 [中等停顿] 让我们先从背景说起。如今,大多数组织都面临着一个看似是数据优势、实则是数据难题的问题。您的网站分析在一个工具中,CRM 记录在另一个工具中,POS 交易在别处,而宾客 WiFi 登录数据又在另一个系统里。每个团队都对客户有着自己的看法,但彼此无法统一。这就是 Twilio Segment 旨在解决的问题。 Segment 是一个客户数据平台 - 即 CDP。它的职责是从每个触点收集第一方数据,将其统一为单一的客户画像,然后在您的下游工具中激活该画像。您可以把它看作是您客户数据栈的中枢神经系统。 [中等停顿] Twilio 于 2020 年以约 32 亿美元的价格收购了 Segment。这告诉了您两件事。第一,市场非常看重 CDP。第二,Segment 的数据基础设施与 Twilio 的通信平台相结合,创造了真正有用的东西 - 一个让您可以收集数据、了解客户,然后通过电子邮件、短信或推送通知与他们取得联系的系统,这一切都源自一个互联的工具栈。 [中等停顿] 让我为您介绍一下它的架构。Segment 有四个核心组成部分。 首先是 Connections(连接)。这是数据管道层。您可以使用 Segment 的 Analytics.js 库来配置您的网站,使用其 iOS 或 Android SDK 来配置您的移动端应用,并使用其服务器库之一来配置您的服务端系统。用户的每一个动作 - 页面浏览、按钮点击、购买、WiFi 登录 - 都会向 Segment 触发一个事件。这些事件使用六种 API 调用类型进行标准化:Identify(识别)、Track(跟踪)、Page(页面)、Screen(屏幕)、Group(群组)和 Alias(别名)。Identify 调用记录用户是谁。Track 调用记录他们做了什么。这种标准化非常重要,因为这意味着无论数据来自哪个源,它都会以一致的模式到达。 [中等停顿] 其次是 Protocols(协议)。这是 Segment 的数据治理层。您需要定义一个跟踪计划 - 一份详细说明您想要捕获哪些事件、每个事件必须携带哪些属性以及适用哪些命名规范的文档。Protocols 会根据该计划验证传入的数据,并标记或拦截不符合规范的事件。对于企业团队来说,这就是干净的数据仓库与混乱的数据沼泽之间的区别。 [中等停顿] 第三,Unify(统一)。这就是发生身份解析的地方。当宾客连接到您的 WiFi 并使用他们的电子邮件登录,稍后又从另一台不同的设备访问您的网站时,Segment 的 Identity Graph 会将这两个会话缝合到一个持久的个人资料中。它通过匹配标识符(用户 ID、匿名 ID、电子邮件地址和自定义外部 ID)来实现这一点。其结果是一个反映了跨每个渠道的每一次互动的单一客户个人资料。对于酒店和零售运营商来说,这尤为宝贵。一位入住过您的酒店三次、点过两次客房服务并点击了您入住后电子邮件的宾客,并不是三个独立的记录。他们是一个具有清晰行为模式的高价值客户。 [medium pause] 第四,Engage(互动)。这是激活层。一旦您拥有了统一的个人资料,您就可以构建受众 - 用 Segment 的术语来说就是细分(segments)。您可以将一个细分定义为:在过去 90 天内访问超过两次、打开过至少一封电子邮件且在过去 30 天内没有进行过预订的宾客。Segment 会实时评估该定义并保持受众成员身份的最新状态。然后,您可以将该受众同步到您的电子邮件平台、您的 CRM、您的广告网络或 Segment 目录中的 550 多个目的地中的任何一个。随着客户行为的变化,受众会自动更新。 您是一位拥有冷静、权威的英国口音的高级技术顾问,正在继续向客户进行简报。以沉稳的自信和沉着的节奏说话。从上一节自然继续: 现在让我们谈谈这对于场地运营商、零售商和酒店品牌来说有哪些有趣之处。 我在部署 CDP 的组织中看到的最常见的一个失败模式,是将其视为一个技术项目而不是一个业务项目。工程团队对数据源进行了检测,数据流入了 Segment,然后……什么也没发生。受众就停留在那里。没有人去激活他们。 原因几乎总是相同的。在开始实施之前没有定义业务用例。因此,这是我给每个客户的规则:在编写单行跟踪代码之前,先定义您的前三个用例。这些数据将赋能什么决策?它将助力什么营销活动?它将执行什么抑制? [medium pause] 让我给您两个具体的例子。 一家拥有 40 家物业、约 2,000 间客房的中型酒店集团正在向其整个宾客数据库运行电子邮件营销活动。打开率约为 12%。他们部署了 Segment,连接了其物业管理系统作为数据源,并构建了三个受众群:过去 60 天内入住过的宾客、超过 12 个月未再次入住的宾客,以及直接预订与通过 OTA 预订的宾客。他们在获客活动中排除了 OTA 宾客 - 毕竟没必要付费重新获取已经认识你的客户。他们向流失客户群体发送了个性化的赢回邮件序列。在 90 天内,来自电子邮件的直接预订收入增长了 34%。数据一直都在,Segment 只是让其变得可操作。 [medium pause] 第二个例子。一家拥有 120 家门店的零售连锁店正面临着经典难题:线上和线下的门店客户数据存储在不同的系统中。一个在线上购买过三次的客户,在走进门店时却被当作新客户对待。他们将电子商务平台、会员 App 以及门店 WiFi 登录数据作为数据源连接到 Segment。身份图谱(identity graph)合并了这些画像。店员可以通过导购 App 看到,眼前的客户是一位高价值的线上买家,但从未在门店购买过。这种背景信息改变了沟通方式。在六个月内,参与门店的平均交易额增长了 22%。 [medium pause] 现在,来看看实施过程中的陷阱。我经常看到以下四个问题。 第一:不规范的跟踪计划维护。团队在没有预先商定命名规范的情况下就开始检测事件。结果导致“已完成购买”、“订单已确认”和“交易成功”代表同一个意思。Protocols 可以防止这种情况,但前提是您必须从第一天起就使用它。 第二:身份解析配置错误。如果设置的合并规则过于宽松,就会开始合并本应分开的画像 - 例如两个人共用一台设备。如果设置的规则过于严格,则会错失真正的跨设备关联。Segment 的默认模型适用于大多数情况,但在上线前请务必检查合并保护设置。 第三:目标渠道过载。团队在第一天就连接了他们能想到的所有目标渠道。一个目标渠道中的数据质量问题会产生级联反应。先从两到三个目标渠道开始,验证数据质量,然后再进行扩展。 第四:GDPR 和同意管理。Segment 的隐私门户(Privacy Portal)允许您从同一个地方管理整个技术栈中的数据删除和抑制请求。但您必须在数据源层级正确配置同意类别。如果用户退出了营销活动,该偏好必须传播到每一个目标渠道。请在上线前进行此设置,而不是在收到第一个主体访问请求之后。 [medium pause] 关于合规性 - Segment 在 GDPR 下作为数据处理者运行。您是数据控制者。Segment 提供数据保护附约和针对跨境数据传输的标准合同条款。他们在 2018 年 5 月生效日期之前就已符合 GDPR 规范。但合规性是一项共同责任。您的跟踪计划、您的同意流程以及您的数据保留政策都需要由您自己管理。 [medium pause] 现在进入快速问答环节,解答一些我经常从客户那里收到的常见问题。 Segment 的实施需要多长时间?对于一个简单的部署 - 一个 Web 源、一个移动源、三个目的地 - 一个称职的工程团队需要四到六周的时间。而包含多个源、Protocols 治理和 Unify 身份解析的完整企业级部署通常需要三到四个月。 它的费用是多少?Segment 根据月度跟踪用户进行收费。免费版涵盖 1,000 个月度跟踪用户。团队计划的起价约为每月 120 美元。企业级定价需协商确定,并随数据量进行扩展。如果您的团队以前没有部署过 CDP,请为专业服务留出预算。 它能与我现有的技术栈协同工作吗?几乎可以肯定。其超过 550 个的目的地目录涵盖了 Salesforce、HubSpot、Braze、Klaviyo、Google Analytics、BigQuery、Snowflake、Redshift 以及大多数主流的营销和分析平台。如果您的工具不在目录中,Segment 的 HTTP API 和 Webhook 目的地可以满足自定义集成的需求。 [medium pause] 最后,让我来总结一下关键要点。 Twilio Segment 是一个成熟且文档完善的 CDP,拥有庞大的集成目录和强大的身份解析功能。其四层架构 - Connections、Protocols、Unify、Engage - 涵盖了从数据收集到激活的完整生命周期。 业务价值来自激活,而非收集。在对您的数据源进行埋点之前,请先定义好您的使用场景。 符合 GDPR 规范需要进行配置,而不仅仅是签署 DPA。在上线之前,请先设置好同意类别和删除工作流。 对于场馆运营商和酒店餐饮品牌,投资回报率(ROI)最高的使用场景通常是:在获客活动中排除现有客户、为流失客户个性化挽回序列,以及通过统一的客户画像丰富场馆内员工使用的工具。 最后 - 如果您正在收集宾客 WiFi 登录数据,那是拥有已验证电子邮件和明确同意的第一方数据。它是您可以连接到 CDP 的最有价值的数据源之一。千万不要让它闲置在独立的系统中。 [medium pause] 以上就是本次简报。如果您想深入了解其中任何一个领域 - 实施架构、使用场景优先级或供应商评估 - 可以获取完整的书面指南。感谢您的时间。

header_image.png

执行摘要

大多数企业 IT 团队管理的都是碎片化的数据架构。网站分析数据存在于一个工具中,CRM 记录在另一个工具中,POS 交易在第三个工具中,而 Guest WiFi 登录数据则在第四个工具中。每个团队都只能看到客户的部分视图。Twilio Segment 客户数据平台 (CDP) 通过从每个触点收集第一方数据,将其统一为单一配置文件,并实时路由到下游工具来解决这一问题。

对于场所运营商、零售商和酒店品牌而言,部署 CDP 不仅是一项数据工程,更是一项商业要求。通过统一身份,您可以在获客活动中排除现有客户,个性化挽回序列,并在广告平台上激活高价值受众。本指南详细介绍了 Twilio Segment 的技术架构、实施路径以及确保投资回报率的供应商中立最佳实践。

技术深潜:Segment 架构

Twilio Segment 架构跨四个不同的层级运行:Connections、Protocols、Unify 和 Engage。理解这一数据流对于规划企业部署的网络架构师和数据工程师至关重要。

cdp_architecture_diagram.png

1. Connections:数据管道

Connections 是摄取和路由层。您可以使用 Segment 的 SDK 和库(用于 Web 的 Analytics.js、用于移动设备的 iOS/Android SDK,以及用于后端系统的服务器端库)来配置您的数据源。

每个用户行为都会使用包含六个 API 调用的标准化架构向 Segment 发送一个事件:

  • Identify:记录用户是谁及其特征。
  • Track:记录用户的行为(例如“Item Purchased”)。
  • Page:记录网页浏览量。
  • Screen:记录移动应用屏幕浏览量。
  • Group:将用户与账户或组织关联。
  • Alias:将匿名 ID 链接到已知用户 ID。

这种标准化确保了数据以一致的格式送达,无论它源自 Retail POS 系统还是酒店预订引擎。

2. Protocols:数据治理

Protocols 作为验证层起作用。在编写任何代码之前,您需要定义一个 Tracking Plan - 一种严格的 schema,用于准确指定允许哪些事件、它们必须包含哪些属性以及所需的数据类型。Protocols 会对照该计划实时验证传入的数据,在不符合规范的事件污染您的下游系统之前将其拦截或进行标记。

3. Unify:身份解析

Unify 是身份图谱。当用户连接到您的网络并进行身份验证时,系统会捕获其设备的 MAC 地址、电子邮件和会话数据。如果该用户随后从其他设备访问您的网站,Segment 会将这些交互合并为一个持久的统一配置文件。它通过跨渠道确定性地匹配标识符来实现这一点。

例如,在 How to make a great first impression with your guest WiFi (and keep your brand consistent) 中讨论了 Captive Portal 的重要性。与 Segment 集成后,该门户将成为主要的身份解析节点,将匿名的物理访客链接到已知的数字配置文件。

4. Engage:受众激活

Engage 是受众构建和激活层。一旦配置文件统一,营销团队就可以定义动态细分受众(例如,“90 天内未到店的高价值访客”)。Segment 会持续评估这些规则,并将生成的受众同步到其支持的 550 多个目标平台中的任何一个,例如 Google Ads、Salesforce 或电子邮件平台。

实施指南

部署 CDP 需要 IT 部门和营销部门之间的紧密配合。请遵循以下部署路径,以避免“收集了数据却无人使用”的常见陷阱。

第 1 步:定义业务使用场景

在准确定义数据将赋能哪些决策之前,切勿编写跟踪代码。确定三个高影响力的使用场景。例如:

  1. 在付费媒体获客广告活动中排除最近的购买者。
  2. 当流失客户登录店内 WiFi 时,触发个性化电子邮件序列。
  3. 将高生命周期价值的客户细分同步到 Meta,以进行相似受众生成。

第 2 步:构建 Tracking Plan

使用 Protocols 创建统一的 Tracking Plan。在整个业务中就标准的命名规范达成一致。始终如一地使用 snake_case 或 camelCase。定义支持这三个使用场景所需的最简可行事件。不要跟踪每个可能的按钮点击。

第 3 步:部署源并进行验证

从两个主要源开始:您的网站和您最可靠的线下数据源,例如 Purple WiFi Analytics

purple_wifi_cdp_integration.png

部署 SDK 并使用 Segment 的调试器来验证事件是否正确触发并符合 Tracking Plan。

第 4 步:配置身份解析

审查 Unify 合并规则。Segment 默认的确切匹配机制运行良好,但您必须确保源系统正确传递标识符。对于共享设备的物理环境,请确保在登出时触发正确的 reset() 调用,以防止出现配置文件合并错误。

第 5 步:连接目标并启用

连接您的下游目标。从一个分析目标(例如 Google Analytics)和一个激活目标(例如电子邮件平台)开始。在 Engage 中构建您的受众群体并验证同步率。

最佳实践

  • 将访客 WiFi 视为主要的身份来源:访客 WiFi 在获得明确同意的情况下捕获经过验证的第一方数据(电子邮件、电话号码)。它架起了匿名人流量与已知数字画像之间的桥梁。确保您的网络架构支持此集成。有关设计考量,请阅读 三种 SSID 统领一切:访客、Passpoint 和 IoT WiFi
  • 强制执行严格的数据类型:使用协议来强制执行数据类型(例如,确保收入始终作为浮点数传递,而不是字符串)。错误的数据类型将破坏下游集成。
  • 标准化硬件集成:将网络基础设施集成为数据源时,请坚持使用受支持的企业级硬件。Purple 与 Cisco Meraki、HPE Aruba、Ruckus、Juniper Mist、Ubiquiti UniFi、Cambium、Extreme Networks 和 Fortinet 无缝集成。

故障排除与风险缓解

GDPR 和同意管理

您是数据控制者;Segment 是数据处理者。在 GDPR 框架下,您必须严格管理同意。如果用户在您的网站上退订了营销邮件,该偏好设置必须传播到每一个下游目标。

使用 Segment 的隐私门户来管理数据删除请求。但是,您必须在源级别正确配置同意类别。在 WiFi 登录过程中捕获明确的同意,并将该同意状态映射到用户的 Segment 画像中。

“目标过载”故障模式

一种常见的故障模式是在第一天就连接 20 个目标。这会导致整个堆栈出现连锁的数据质量问题。请按顺序连接目标。在添加下一个目标之前,先验证目标工具中的数据流。

ROI 与业务影响

CDP 的投资回报率主要通过三个维度来衡量:

  1. 广告支出效率:通过使用统一的 CDP 受众在获客广告中排除现有客户,组织通常可以减少 10% 到 20% 的浪费性广告支出。
  2. 活动收入提升:由实时行为触发器驱动的个性化交叉销售和赢回活动所产生的转化率,明显高于群发邮件。
  3. 运营效率:自动化的数据管道和受众同步消除了数据工程师和分析师以前执行的手动 CSV 导出和数据对账工作。对于 酒店业交通运输业 的企业而言,实体客流量是衡量互动的主要指标,通过 Segment 将这些实体数据与数字技术栈相连,可以立即带来商业优势。

关键定义

身份解析

基于确定性或概率性匹配不同数据点(Cookie、设备 ID、电子邮件)以创建单一、统一的客户档案的过程。

当 IT 团队需要在用户身份验证后将匿名网站访问者与已知 CRM 记录进行合并时。

跟踪计划

定义允许进入 CDP 的确切事件、属性和数据类型的正式 Schema。

数据工程师用于管理数据质量并防止未记录的事件污染数据仓库。

第一方数据

公司在其明确同意的情况下直接从其客户那里收集的信息,例如 CRM 记录或宾客 WiFi 登录信息。

由于主流浏览器已弃用第三方 Cookie,这对于营销策略至关重要。

Source

生成数据并将其发送到 Segment 管道中的任何系统、应用程序或网站。

常见的源包括 iOS 应用、Node.js 服务器以及像 Purple WiFi 这样的硬件集成。

Destination

从 Segment 接收数据的任何下游工具或平台。

常见的目的地包括 Google Analytics、Salesforce CRM 和 Snowflake 数据仓库。

Audience

由特定特征或行为定义的动态用户细分,由 CDP 实时更新。

营销团队用于触发针对性活动或在广告中排除特定用户。

确定性匹配

基于唯一标识符(例如电子邮件地址或用户 ID)的完全匹配来合并客户档案。

最准确的身份解析方法,首选用于合规性和定位准确性。

数据处理者

在 GDPR 规定下代表数据控制者处理个人数据的实体。

Segment 充当数据处理者,这意味着场所运营商(控制者)仍负责获取用户同意。

应用实例

一家拥有 200 间客房的酒店需要停止针对已预订住宿的宾客投放广告预算,但其预订引擎数据与 Google Ads 账户断开了连接。

  1. 将酒店预订引擎连接为 Segment 中的 Source。
  2. 触发名为 Booking CompletedTrack 事件,其属性包括 booking_valuecheck_in_date
  3. 在 Segment Engage 中,创建一个定义为“在过去 60 天内执行了 Booking Completed 的用户”的 Audience。
  4. 将 Google Ads 连接为 Destination。
  5. 将该 Audience 同步到 Google Ads,并在所有获客活动中将其应用为排除定位列表(排除列表)。
考官评语: 这是经典的受众排除使用案例。它通过消除浪费的广告支出来提供即时投资回报率。另一种替代方案(手动从预订引擎导出 CSV 并将其上传到 Google Ads)速度慢、易出错,且违反了数据安全最佳实践。

一家零售连锁店希望在高价值在线购物者首次登录店内 WiFi 时,触发一封提供 10% 折扣的个性化电子邮件。

  1. 将电子商务平台和 Purple 宾客 WiFi 连接为 Segment 中的 Source。
  2. 电子商务平台传递 Identify 调用,附带客户的电子邮件和计算出的特征 Lifetime_Value > 500
  3. 当客户登录商店 WiFi 时,Purple 会触发具有相同电子邮件地址的 Identify 调用。
  4. Segment Unify 将在线档案与实体访问数据进行合并。
  5. 创建一个由 WiFi Login 事件触发的 Engage Journey,并针对具有高价值特征的用户进行过滤。
  6. 该 Journey 向电子邮件平台发送一个 Webhook 以触发折扣码。
考官评语: 这种方法桥接了线上到线下的差距。通过使用电子邮件地址作为确定性匹配键,身份图谱成功地实时将电子商务档案与实体店访问联系起来,从而实现即时激活。

练习题

Q1. 您的营销团队希望跟踪新移动应用上的 150 种不同用户交互并发送给 Segment。您应该如何应对这一实施需求?

提示:考虑维护成本和数据的目的。

查看标准答案

拒绝该请求。要求营销团队定义每个事件将支持的具体业务决策或营销活动。将列表缩减为这些用例所需的最低可行事件,并在跟踪计划(Tracking Plan)中记录这些事件,且仅实施这些事件。在没有明确用例的情况下跟踪数据会产生技术债务。

Q2. 客户要求根据 GDPR 删除其所有个人数据。您如何在连接到 Segment 的包含 15 个不同下游工具的技术栈中执行此操作?

提示:关注 Segment 的隐私功能,而不是手动删除。

查看标准答案

使用 Segment 的 Privacy Portal 发布删除请求。Segment 将在其自己的存档中处理删除,并自动将删除请求转发到所有受支持的下游目的地,从而确保整个技术栈的合规性,而无需在 15 个单独的工具中进行手动干预。

Q3. 您注意到单个用户在 Segment 中有两个独立的配置文件:一个包含其网站浏览历史记录(匿名 ID),另一个包含其 WiFi 登录数据(电子邮件地址)。为什么 Unify 没有合并它们?

提示:身份图谱(identity graph)如何将匿名流量与已知用户联系起来?

查看标准答案

用户尚未在网站上执行将匿名 Cookie 与其已知电子邮件地址联系起来的操作。要解决此问题,您需要在网站上执行一个身份验证事件(例如登录或订阅新闻通讯),该事件会触发 Identify 调用,同时传递匿名 ID 和电子邮件地址。一旦发生这种情况,Segment 将把历史浏览数据与 WiFi 配置文件进行合并。