王牌技术 · 起源
联邦学习诞生于2016年的谷歌输入法优化项目,在互联网产业中存在三种服务形态:横向联邦学习、纵向联邦学习和联邦迁移学习。
2020年4月,为应对国际形势严峻挑战,中央出台关于完善要素市场化的重要文件,数据作为新型生产要素写入文件中,与土地、劳动力、资本、技术并列为五个生产要素。一方面,数据区别于传统生产要素的最大特征是严格要求保护个人数据隐私,是个人权利不可侵犯的体现,受到法规严格保护。另一方面,数据的开放共享又是人工智能为用户提供便捷服务的基础,是数字经济发展的命脉之所在,也是中国在下一轮国家间新技术竞争中取胜的关键。
因此,数据成为生产要素的难点在于实现隐私保护和数据开放共享之间的平衡,产业界一般采用联邦学习技术解决该问题。
可信媒介 · 原因
能够获得如此热度和重要性,联邦学习和区块链有个重要的共同特征:可信。俗话说“人心隔肚皮”,陌生人之间一般难以建立信任,这是因为在资源有限的社会竞争中,获得更多利益是人的本性,人们担心被欺诈而损失利益,信任对市场经济中的作用不言而喻。
在传统市场中,交易由权威机构监督执行。例如,政府制定《消费者权益保护法》及《产品质量法》,并对违法行为进行惩罚。也就是说,权威机构提供“可信媒介”作用,为市场交易保驾护航,尤其是对于常见商品,质量、价格等细节均有十分详尽、标准化的管理方案。
在新兴的互联网市场中,智能终端设备依据摩尔定律飞速发展、光纤网络和5G无线网络逐步普及,产品创新层出不穷。相比之下,权威机构需要经过较长时间调查和研究方能制定相应法规,这使得很多互联网产品短时间内得不到权威机构的“可信媒介”作用,进而使得用户不敢放心大胆的使用新产品。例如,在互联网电子支付出现7年之后,权威机构才为部分互联网企业发放支付牌照,这才有了后来无处不在、十分便捷的手机支付形式。现如今,点对点转账(提高跨境交易的便捷性)、互联网大数据合作(提高用户服务水平)等新产品,尚缺乏成熟的法律法规来进行必要的管理与规范,亟需可用的“可信媒介”。
联邦学习和区块链正是在这样的背景下诞生的技术派“可信媒介”。联邦学习的可信在于,在数据合作过程中使用的是不可逆的变换数据,即使没有权威机构监督,隐私数据也不会泄露。区块链的可信在于,在记账过程中使用了群体共识和数字签名技术,即使没有权威机构监督,所记录的交易也是不可篡改且不可抵赖的。因此,这样的技术“可信媒介”将为国民经济持续健康发展提供新的生产力。
联邦学习/区块链 · 对比异同
深入分析,我们发现联邦学习和区块链有很多相似之处,表格1详细对比了两项技术的共同点和差异。
表 1 联邦学习与区块链的异同
联邦学习/区块链 · 应用场景
在应用上,两者均用于互联网场景。不同之处在于,联邦学习用于个性化的用户服务,区块链则用于点对点的交易记账和合约。
京东数科在联邦学习领域已经成功实现了多个项目的落地应用。例如,在疫情期间,为确保疫情过后农业生产生活的快速恢复和正常开展,京东城市基于联邦学习、同态加密、数据隐私保护的数字网关技术,在保证数据不出库的基础上,联合四川省德阳市广汉市农业农村局部署了“西南禽苗交易信息平台”,帮助中小企业动态、实时匹配禽苗供需信息,上线不到两周,即完成禽苗交易1250450羽。
京东数科也将联邦学习用于人脸识别,在配合式场景下(如自拍照对比自拍照),当误检率为十万分之一的情况下,通过率高达99.96%,当误检率为万分之一的情况下,通过率则高达99.99%。
而在区块链上,京东数科更是将其运用在了品质溯源、数字存证、信用网络、金融科技、价值创新等多个领域。
在品质溯源上,在行业内首创AI+区块链溯源应用,打造了普洱茶区块链防伪追溯平台,有效解决了普洱茶流通过程的痛点。截至2020年5月,京东数科的区块链防伪追溯平台智臻链,已有超13亿追溯数据落链,900余家合作品牌商,7万多件入驻商品,逾700万次售后用户访问查询,覆盖生鲜农业、母婴、酒类、美妆、二手商品、奢侈品、跨境商品、医药、商超便利店等丰富业务场景。
京东数科首创“茶脸识别”技术
在数字存证上,京东数科依托其自主研发的区块链数字存证平台,实现了可信存证、自动化取证、一键举证、侵权预警等功能,目前已经应用于电子合同、电子发票、电子证照、电子票据、互联网诉讼、版权保护等场景。其中,区块链电子合同平台已服务超百万次合同签约。
京东区块链数字存证平台功能一览
在信用网络上,针对消费租赁市场纠纷取证难问题,信用租赁平台“京小租”使用区块链技术,通过自动化流程获取租赁业务中租赁协议、订单数据、租赁流程等数据并完成“上链”操作,保证租赁服务的公开透明。这项技术同样被京东数科运用于数字身份、企业通用账号、信用租赁、物流征信等方面,为企业经营和个人生活提供便利。
在金融科技上,京东数科区块链早在2017年就应用于资产证券化领域。比如,2019年6月推出的首个区块链ABS标准化解决方案,能帮助资产方、计划管理人、律师事务所、评级机构、会计师事务所、托管行等ABS业务参与机构优化业务流程,节约时间成本,提升ABS发行业务效率。
除此之外,京东数科还正式开源了京东区块链底层引擎JD Chain。JD Chain面向企业通用业务场景而设计,满足企业积木化按需定制,让企业快速接入区块链世界,帮助企业进行海量高效数据治理。
JD Chain关键技术特性
应用基础
两项技术均需要有协作意愿和共识的计算节点。不同之处在于,联邦学习要求节点之间的数据具有互补性,例如其中一个节点存储消费习惯特征,另一个节点存储性格、爱好等特征。各节点之间的共识为联邦算法,通过约定在联邦之间的信息交互协议,实现模型训练及推理。
区块链需要各节点同步记录所有交易信息,例如账户A给账户B支付1个代币,A的支付信息及签名将发送给网络上的所有节点,各节点产生一致的记录。区块链网络里能够达成一致,最关键的技术是共识算法。共识算法是解决一致性问题的关键,在分布式、去中心化的区块链网络中协助节点保持数据一致。常用的共识算法如工作量证明(POW)、拜占庭容错(BFT)、股份授权证明(DPoS)等。
应用目标
两项技术的目标都是在去中心化网络中增强节点之间的互信。不同之处在于,联邦学习在于实现“数据可用不可见”的隐私保护技术,并通过融合使用各方数据提升用户服务的质量,进而创造出新的价值。例如同态加密就是一种隐私保护技术,所产生的密文与明文完全不一样,分布性质和排序性质都发生了巨大变化,这使得原始数据是“不可见”的,密文可按指定规则进行运算,进而实现梯度下降算法和模型优化,实现了“可用”。
区块链旨在确保交易记录不可篡改,利用共识算法、分布式技术解决在去中心化网络中的双重支付问题,最终实现数字世界的价值表示和价值转移。例如在比特币系统中,账户A给账户B支付1个比特币,并将该信息广播给所有“矿工”节点,“矿工”为了获得系统奖励,都努力将该信息打包到新区块,并为了获得更多奖励争当历史区块的见证者,这便使得该信息在区块链中不可篡改。
强强联合 · 未来
联邦学习和区块链有共同的应用基础,通过技术上的共识实现多方合作的可信网络,具有较好的互补性。从应用目标来看,联邦学习在于创造价值,而区块链旨在表示和转移价值,因此有以下两种基本结合形式。
图 联邦学习与区块链的结合方式
第一种结合是利用区块链的记录不可篡改特性,对联邦学习合作方可能面临的恶意攻击进行追溯和惩罚。例如,在多个参与方进行联邦学习的同时,部署区块链用于记录联邦学习的数据指纹(包括建模样本、推理样本、交互信息),而对应的原始数据存储于参与方本地。当发现有样本遭受恶意攻击时,由各参与方或者第三方组成调查组,依据区块链记录的指纹对原始数据进行核验,便可以找出具体是哪一方遭受了攻击,进而采取相应的措施。
第二种结合是利用区块链的价值表示和转移功能,对联邦学习服务所创造的价值进行记账和利益分配。例如,在多个参与方进行联邦推理的同时,部署区块链用于记录用户服务的接口调用日志指纹、各参与方的贡献、该服务所产生的收益,并通过智能合约自动将收益分配给各参与方。这种方式与现有的按条计费不同,可以更精准地评估每次调用的质量,从而激励参与方确保调用的准确性,并积极优化效果。
原文链接:https://mp.weixin.qq.com/s/b87vEUEhXbkdu1AFihUDhA
了解更多数科技术最佳实践&创新成果,请关注“京东数科技术说”微信公众号