在11月6日召开的Techo开发者大会上,腾讯云副总裁、腾讯数据平台部总经理蒋杰博士对外披露腾讯大数据平台在长达十年的时间中已经经历了四代演进。经过十年的积累,腾讯大数据平台的算力资源池目前已有超过20万台的规模,每天实时数据计算量超过30万亿条,腾讯已经成为中国实时数据计算量最大的公司。随着资源管理平台核心TKE和分布式数据库TBase正式对外开源,腾讯正在成为大数据领域开源最全面的公司。
作为全球最大的互联网公司之一,腾讯的数据量在短短五六年时间增长了几千倍,目前每天产生的数据量超过几十万亿条。为了应对这种爆炸式增长,腾讯走出了一条技术引进+改造+自研的道路。针对最新的大数据和人工智能技术发展趋势,腾讯正在下一代计算平台中,探索批流融合、ABC融合以及数据湖和联邦学习等前沿技术。
腾讯内部目前有超过100万台服务器,腾讯云联合所有业务部门,利用业务空闲资源打造一套算力共享平台,该算力弹性资源池有20万的规模,大数据平台每天有1500万的分析任务、30万亿次的实时计算量,并且每天数据接入条数达35万亿。此外,腾讯云的分布式机器学习平台,能支撑1万亿维度的数据训练。目前,腾讯已经把网络、存储、数据库等IaaS能力,大数据、机器学习等PaaS的能力,以及上层的图像、语音、NLP、BI等SaaS能力,通过腾讯云对外开放。
对于大众关心的保证数据安全的问题,蒋杰博士表示,腾讯在整个体系内部进行强管控的访问管理,内部数据存储都做了整体加密。腾讯各部门之间或者跟其他企业之间需要数据共享时,都是通过联邦学习的方式来解决,分享的都是训练后的、已经脱敏的数据。
人工智能技术网 倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至1851688011@qq.com我们将及时沟通与处理。!:首页 > 大数据 » 腾讯大数据平台十年四次升级 正成为大数据领域开源最全面的公司