近日,游戏界迎来了一次技术曝光的震撼事件,一份据称来自索尼内部的视频被匿名人士公开,揭示了PlayStation团队正在探索的一项前沿技术——基于AI驱动的《地平线:西之绝境》女主角埃洛伊。这段一分钟的视频演示,通过语音指令与游戏角色实时互动,瞬间吸引了业界内外的广泛关注。
视频中,索尼互娱软件工程总监Sharwin Raghoebardajal亲自上阵解说,展示了这一技术的核心亮点:埃洛伊不仅能够准确理解玩家的语音指令,还能通过高度拟真的合成语音和动态面部表情进行即时回应。这一突破性成果,由PlayStation Studios前沿技术部门(涵盖AI、计算机视觉等前沿领域)倾力打造。
从技术架构来看,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步策略。玩家的语音首先通过OpenAI的Whisper技术转换为文字,然后借助GPT-4和Llama3双引擎进行对话内容的生成和决策。接下来,自研的情感语音系统(EVS)为角色赋予了逼真的声线,而Mockingbird技术则进一步将音频实时转化为角色的面部动画,实现了与玩家的无缝互动。
值得注意的是,这一原型系统已经成功融入了《地平线:西之绝境》的实际游戏场景,尽管索尼强调这仅仅是与Guerrilla Games合作开发的内部技术验证演示。据透露,该技术已在PS5主机上完成了适配测试,且额外的运行效能损耗几乎可以忽略不计。
索尼首次在内部展示这一技术是在一年前,随后在去年的东京索尼技术交流展(STEF)上展示了更新版本。这次技术泄露正值游戏开发者大会(GDC)前夕,无疑将在大会上引发更多的技术讨论和关注。尽管索尼对泄露视频保持沉默,但版权代理迅速下架了相关视频。
除了索尼,其他大厂也在AI领域展开了积极探索。英伟达推出的ACE技术同样支持玩家与NPC的自由对话,并与Inworld AI合作在《Covert Protocol》中进行了多次可玩演示。微软也与Inworld AI联手,致力于打造Xbox生态的生成式AI角色系统,并自研Muse AI模型,以辅助开发者快速构建游戏场景。
随着AI技术的飞速发展,游戏行业也面临着前所未有的变革。2024年游戏开发者大会的一项调查报告显示,近半数的受访者表示其工作场所正在使用生成式AI工具,而超过三分之一的受访者个人也在使用相关技术。这一趋势无疑加剧了游戏从业者的担忧和期待。
英伟达ACE技术的演示同样令人印象深刻,展示了AI技术在游戏交互方面的巨大潜力。随着技术的不断进步,玩家与游戏角色的互动将更加自然、真实,为游戏体验带来全新的变革。