戴上头显设备
沉浸式体验了一把VR“登月之旅”
4K级的高清画质让观影者如宇航员一般
置身浩瀚的宇宙
先后“踏入”空间站
“登上”太空电梯
游览探月基地
感受太阳风暴
……
这件奇妙的VR体验设备,来自深圳南山一家初创企业——深圳元象信息科技有限公司(以下简称“元象”)。成立仅3年的元象,是目前国内少有同时具备“AI+3D”两种核心技术的初创企业。2024年元象进军VR大空间市场,短短半年时间,推出5部VR精品内容,落地全国33个城市,一跃成为行业领跑者。
为探寻其背后的创新密码,记者采访了元象科技联合创始人肖志立,他说,“AI提升智能,3D侧重呈现,AI技术是驱动3D内容的绝佳工具引擎。”
游客戴上头显设备体验虚拟现实场景展。图源:新华社
“我们的创始团队全部脱胎于腾讯。”肖志立介绍,元象创始人姚星是前腾讯副总裁和腾讯AI Lab创始人,曾带领团队参与创建了王者荣耀 AI“绝悟”、围棋国家队AI陪练“绝艺”等知名AI产品。
2016年,姚星去英国访问DeepMind创始人Demis Hassabis,第一次关注到AGI(通用人工智能),了解到虚拟仿真是通往AGI的有效路径。回到国内,姚星带领团队开始探索腾讯的AGI路径。然而在实践过程中,姚星逐渐意识到DeepMind的AGI路径存在局限性。
2020年,“全真互联网”概念诞生,这一年,姚星离开腾讯,并于2021年成立元象。姚星说,他想去做真正的仿真世界,希望将AI和3D融合,构建出一个更加智能且真实的数字世界。
成立后的元象,不仅拥有全链路的AI大模型技术能力,还有着对移动互联网发展和虚拟仿真技术的深刻理解,很快便瞄准两大市场机遇开始发力。
首先,“信息升维是必然”,元象将3D元宇宙作为创业的起点;其次,“智能化是趋势”,随即元象又发展出AI+3D的组合技术,希望用AI+3D技术打通“虚拟”和“现实”,通过持续提升认知智能和感知智能,打造AI智能体。
短短3年时间,元象锚定AI+3D赛道不懈创新。先后研发出多个“顶流”技术产品,包括广东首批获国家备案的元象大模型、国内最大参数MoE开源大模型、“端云协同”的3D互动技术、国内首个基于物理的3D动作生成模型等,并连续3年入选胡润全球独角兽榜。
现场法国游客体验。图源:元象XVERSE
如果在元象诸多“顶流”技术中选一个难度最高,最能体现元象创新精神的,无疑是团队去年开发出的当时国内最大参数的MoE(Mixture of Experts)开源模型。MoE模型是业界最前沿的混合专家模型架构,谷歌Gemini-1.5、OpenAI的GPT-4等大模型都使用了MoE模型。
“大模型本身链路很长,无论是数据采集、数据标注、算法优化,还是高成本开发训练,困难都是综合的。而MoE模型又是众多大模型中复杂度最高,可参考资料和案例最少的大模型架构。”肖志立说,对初创企业来说,最难的莫过于是否决定要倾注所有资源“All in”专攻一次成型的高难度MoE模型训练。
“我们没有先行者提供的实验经验,只能通过论文或自己研究的方法大致确定有效性,所以做‘All in’的决策压力很大。”肖志立说,“在训练MOE模型时,需要经历无数次小的点火,才能最终让大的点火成功。每一次点火,团队成员心都是悬着的,等待验证的心情就像在观测发射卫星火箭一样,每天都很焦虑。”
最终,在反复实验和试错后,元象成功研发出中国最大MoE开源模型:XVERSE-MoE-A36B,加速了AI应用低成本部署,将国产开源模型提升至国际领先水平。
此后,元象基于MoE模型自主研发出APP“Saylo”,通过逼真的AI角色扮演和有趣的开放剧情,迅速火遍港台并成功出海。
在AI+3D技术的辅助下,元象打造的智能数字世界不仅能支持实拍视频生成3D场景,应用大模型创作和润色策划方案,还能让数字人与用户进行实时沟通和互动,这也是VR大空间市场取得成功的重要原因。
“接下来,元象会凭借敏锐的洞察力和专注的科研力,持续在人工智能、机器学习、3D渲染引擎等领域创新研究,驱动原创技术持续进步,为深圳的科技发展贡献力量。”肖志立说。