北京抖音信息服务有限公司(以下简称“抖音集团”)作为字节跳动国内信息和服务 业务板块,拥有抖音、今日头条、西瓜视频、番茄小说等产品。 抖音集团用户中台在业务实践中,积累了大量的用户数据,集团内部多业务均对这些 高价值数据有强烈的应用需求,典型场景包括新客推荐、精准营销、账号风控等。 然而用户中台的高价值数据因为合规原因不能直接共享给集团内其他业务方,导致数 据价值发挥受限。因此,针对抖音集团不同业务间的数据合规安全共享需求,需设计一套 科学、易用的评估体系,通过构建完整的数据保护方案,在兼顾安全前提下促进数据要素 价值释放。
基于集团各业务间合规共享数据的需求, 我们建设了一套基于可信隐私计算技术的抖 音集团数据合规共享与流通平台——隐私数据中台,在实践中不断探索,既好又快地解决 了多场景的业务痛点。 Jeddak Control Network (JCN) 系统 负责控制面管理,是基于 C-S 架构的隐私计算联盟信息管理平台,负责各类平台信 息(用户、数据、项目、权限等)的注册和增删改查,以及隐私计算任务的发起、中间结 果监控和结果的提取上报。 Jeddak Data Network (JDN) 系统 负责数据面管理,是基于 P2P 计算模式的隐私计算核心框架,负责实施计算之间的 网络连接、密态数据交互、隐私保护运算。 隐私数据中台为了满足丰富的多场景业务需求, 经过实践多轮迭代,在技术指标层面 实现了多点突破。 1. 大规模数据处理。隐私数据中台可支持 10 亿级数据的隐私计算,具有较高的运行 稳定性; 2. 能效平衡优化。隐私数据中台可在 4 小时内完成 1 亿级样本联邦训练,并在 1 小 时内完成 10 亿级联邦推理。
技术创新方面, 一是面对空前的业务流量规模挑战,经深度优化," 隐私数据中台 " 产品可轻松调度处理每日海量的隐私计算任务,远远领先于传统隐私计算框架。二是面对 不可靠和弹性分布式的云原生基础设施,“隐私数据中台”产品深化了高可用和水平扩展 设计,能够以极高服务水平运行在上万核的云集群基础设施。 应用创新方面,抖音集团实现了隐私数据中台的业务应用与法律风险评估流程一体化, 二者互相配合并补位,数据权限、合规审批等功能可在平台内闭环完成。 模式创新方面,国内鲜有的致力于服务全集团体系的大中台化产品,支持系统化的数 据互通协作共享。覆盖多重技术应用能力,是集成多元化功能的复合型技术平台。功能间 可衔接叠加,需求方可以在平台内实现闭环,未闭环的与公司内部各基建平台打通,可用 性强。
经济效益方面, 隐私数据中台的成功实践,在抖音集团内部取得了丰硕的成果, 以 下列举三个典型场景来说明该案例在抖音集团内发挥的经济效益。一是某新业务需要在 业务规则中过滤掉未成年用户,借助用户中台的用户画像数据,通过匿踪查询(PIR) 实 时获取用户是否属于未成年人,提高了该业务的运营合规性,获取了用户中台的数据价值; 二是某成长型业务需要在首页推荐栏位给用户提供更精准的商品推荐服务,借助用户中 台丰富的画像数据,通过联邦学习(FL)构建该业务的定制商品推荐模型, CTR 相对提 升 1.148%,符合业务部门预期;三是电商主播带货业务需要基于用户中台的用户画像 数据,通过多方安全计算(MPC)来对主播粉丝商品购买偏好进行统计分析, 以便为主 播推荐更精准的带货策略。 社会效益方面,隐私数据中台项目在抖音集团的成功探索,形成了企业级的最佳解 决实践,对于大型集团企业落地基于隐私计算的数据流通新范式具有标杆性,对行业发 展有促进作用; 同时也为国家数据局及地方政府合理有序地开放公共数据,发挥数据要 素乘数效应,促进数字经济规模化发展,提供了行之有效的参考样例。