OpenAI昨天正式发布了大家期待已久的GPT-4o,"o"即"omni",意为"全能",作为多模态大模型,它整合了文本、图像、视频和语音处理功能,可以实时地回应用户的各种需求。
从发布会现场的演示中不难看出,GPT-4o与以往版本最大的特点是增加了语音、视觉等多模态实时交互,并且在交互过程中展现出了惊人的情感感知、模拟与思考能力。
由公司投资的大模型研发团队西湖心辰在2021年成立时,就已经关注到AI大模型在人机交互上的情感能力短板,并潜心研究致力于打造兼具高智商和高情商的多模态大模型。电影《Her》可以说是西湖心辰团队的启蒙老师,初创团队在看完电影后,被剧中Samantha的形态及背后技术,尤其是AI与人情感共鸣的能力所吸引,当下便立志要“打造陪伴十亿人的AI伴侣”。
2023年7月西湖心辰推出了自研通用多模态「西湖大模型」,它具备跨模态理解和生成能力,更重要的是它能够感知用户情绪并记住用户的历史互动信息。通过深度定制模型的人设、性格和偏好,它能够以更有温度、更个性化的表达方式与用户进行互动。
在大模型能力应用落地方面,西湖心辰也在持续探索。近一年与汤姆猫开展深度联合研发,基于「西湖大模型」底座共同推出的多模态智能对话模型,让汤姆猫系列产品真正具备了能听、 能看、 能说的能力,更好地实现儿童教育与陪伴。
西湖心辰自创立以来就专注于AI情感领域研究,致力于打造富有温度、更懂人心的AI大模型,并以此为使命,旨在服务好社会大众,这与Open AI未来的愿景不谋而合。此次GPT-4o更新展示了自然、生动的人机交互,填补了部分人工智能在情感方面的不足,也从侧面印证了西湖心辰独到的战略部署能力。
未来,西湖心辰将针对“目标导向的长程对话”“多模态拟人化”这两个行业重难点持续发力,让西湖大模型能够做到无限回忆、主动发问、交错回复的同时保持高逼真的拟人度,为超拟人AI的技术突破贡献一份力量。
人工智能技术网 倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至1851688011@qq.com我们将及时沟通与处理。!:首页 > 人工智能产业 > VR|虚拟现实 » GPT-4o迈向更自然的人机交互,在 AI 情感感知领域做耕耘突破