谷歌的研究团队最近提出被称为AudioPaLM的大规模自然语言模型,它证明了理解口语内容和自主生成口语的能力。
支撑AudioPaLM的是两种型号PaLM 2和AudioLM的组合,与多模式操作框架相关。这种融合允许倾听和理解语言内容,然后通过自动人工智能生成口语。

除了识别声音内容和促进自然交互外,AudioPaLM还可以处理各种语言翻译功能。这项创新有望通过听特定的口语内容并立即将其转换为另一种语言,从而彻底改变跨语言交流。
然而,这一技术奇迹目前仍处于研究阶段谷歌尚未透露其是否打算将此技术集成到现有的服务(如谷歌翻译)中,或在其他产品或服务应用程序中使用此技术。
相关文章
网友评论(共有 0 条评论)