深研联邦学习 京东数科持续夯实自身实力

2020-08-06 18:15:50大众网

  互联网的快速发展,给人们的生活带来了实实在在的便利与高效,但是也给人们带来了越来越多的隐私泄露隐患,那么如何平衡科技发展和数据保护变成了难以突破的壁垒,而今深耕数字科技的京东数科便针对这一问题,提供了全面的最优解答,那便是联邦学习。 

  而2006年开始掀起的深度学习热潮,更把AI和机器学习模型对数据的需求推向了顶峰。

  什么是联邦学习?就是在满足数据隐私安全和监管要求的前提下,让人工智能系统更加高效准确地共同使用各自数据的机器学习框架。

  应用方面,举一个简单的例子:各企业或机构大家都出不同的数据,相互进行模型学习,又不会看到对方的数据。数据还可能分布在不同的国家,各国数据监管政策有所不同,也可以把分布在各国数据高效利用、训练模型,不存在数据上的交换。

  两个典型的联邦学习算法,分别是横向联邦学习和纵向联邦学习,横轴表示特征维度,竖轴表示用户维度。

  横向联邦学习,看两方的数据和标签,用户重合度非常低,特征重合度比较大。这里显示的是用户无重合的极端情况,实际情况中它可能仅仅重合90%用户特征,5%用户重合,到时进行对齐即可。

  纵向联邦学习,两方用户重合较多,可对用户的部分对齐。A、B各拥有用户一部分数据,可能都会有用户的一部分标注,纵向联邦学习也能去处理。

  对计算机视觉、自然语言语音识别等领域而言,2006年深度学习(的出现)是非常大的推动。大家熟悉的语音识别、语音合成、人脸识别等应用,都是大量深度学习模型在背后发挥作用。

  区块链受到很大关注,数据上链有透明化、分布式、不能篡改等优势,它是一种不依赖第三方,通过自身分布式节点,进行网络数据存储验证传递和交流的技术方案。区块链的分布式、去中心化特点,和联邦也有一些关系。实际上,联邦学习在大型的多方参与项目中都有类似机制,也可以考虑采用去中心化。最简单的应用是,把联邦学习和区块链结合,建立在区块链上的联邦学习算法。我们也完成了二者更深层次的融合,包括共识机制等。京东数科认为二者的结合在未来会有越来越多的应用。区块链可以解决数的存储,具有不可篡改性,联邦学习能对数据隐私做表保护,其中有不少地方互补。

  区块链是数字科技发展的得力帮手,而联邦学习则是数字科技持续快速发展的助推剂,眼下,联邦学习已经帮助京东数科在数字科技领域取得先发制人的优势,未来,随着京东数科研发投入的不断增加,相信京东数科一定会不断夯实自身实力,同时,推动行业健康持续发展。

编辑:彭茹

推荐

版权所有:共青团中央网络影视中心