在Skype网页版活跃的年代,实时字幕与翻译一直是个持续进化中的功能。从早期仅为英语、西班牙语等少数语种提供翻译预览,到覆盖20种甚至90种以上语言的字幕系统,每一次技术迭代都向跨国沟通无障碍的目标靠近一步。
甚至早在第一款Skype实时翻译功能推出的十年前,微软的工程师团队已在为“星际迷航式通用翻译器”铺路。
从Skype Translator到Universal Translator
2014年5月,微软首次对外展示了Skype Translator的测试版。这项由Skype与Microsoft Translator团队共同开发的技术宣布“两个不同语种的人之间交谈,借助Skype Translator可实现无障碍交谈,当你说出一个完整的句子后,系统便会开始进行记录翻译,对方即可听到翻译后的句子,并可通过字幕显示在屏幕上”。
2014年底,该功能以Windows 8 beta应用的形式面向少数用户开放,支持英语和西班牙语的互译。微软计划“很快将其拓展到其他平台,比如Mac和iPhone”。2015年,Skype宣布面向所有用户开放视频通话的实时翻译功能,用户无需注册Skype Translator先行版即可使用,支持语音翻译和字幕翻译两种形式,字幕翻译还可以保存为聊天记录。
2015年10月,微软将这一技术正式命名为“Star Trek-like universal translator”,并宣布其已可支持英语和西班牙语的实时双向翻译。Microsoft Translator团队提供的幕后数据是,该功能采用了深度神经网络技术,可在听取对话的过程中不断改进自身功能。
到2016年,Skype for Business也开始引入这一技术,支持40种语言的会议直播字幕翻译。同一年,Skype的实时翻译功能完成了对日语等更多语种的适配。
2018年大更新:向所有平台开放实时字幕
2018年12月3日,微软在联合国国际残疾人日当天正式宣布,将在Skype中加入实时字幕与副标题功能。公告发布后,Skype for Web、iOS、Android、Mac及Linux等全平台用户均可使用。微软在公告中写道,实时字幕功能让听障用户也能“阅读通话中实时滚动显示的字幕”。
这一功能在Skype 8版本(支持Android 6.0+、iPhone、iPad、Linux、Mac、Windows和Skype for Windows 10)上即可使用。用户只需要在通话中选择“+”按钮,然后选择“开启字幕”功能即可完成设置。也可以点击右上角的“更多”菜单,在弹出的选项中选择“开启字幕”。
当时支持的语言包括英语、中文、法语、德语、意大利语、日语、葡萄牙语、俄语、西班牙语等9种,但在PowerPoint上将计划支持12种讲者语言和超过60种字幕语言。
2022年:通话界面升级与语言自动检测
2022年7月,Skype Insider Build 8.87.76.203在桌面端的通话屏幕上直接添加了新的通话字幕功能,用户可以直接从通话屏幕轻松启用。
2022年10月,微软在Skype Insider Build 8.90.76.202中为所有平台的通话字幕和翻译添加了自动语言检测支持。微软官方表示:“例如用户A说英语,用户B说法语,则翻译将自动配置为en-US <-> fr-FR开始。如果用户B开始说捷克语,则翻译将重新配置为en-US <-> cs-CZ。用户A和B不会感知到变化”。
在此之前,用户需要在通话前手动选择语言对,该功能显著降低了使用门槛。Skype Insider 8.90还在桌面版通话屏幕的菜单栏中,将原本需要点开三级菜单才能找到的字幕开关直接移到了顶层菜单,点击一下即可启用实时字幕。
原生与第三方共存的时代
随着Skype官方字幕功能的逐渐完善,一批第三方字幕生成工具也纷纷涌现。AI实时翻译软件Akkadu就曾提供针对Skype通话的字幕生成服务,用户可先在其软件中选择语言并点击开始,再打开Skype通话,第三方工具就会将对话实时转写为字幕。这项技术在Skype官方字幕功能尚未成熟的几年里曾填补了不少使用缺口。
实时字幕融入Teams:SKype网页版生命末期
随着Skype网页版正式于2025年5月5日停服,微软将所有用户迁移至Microsoft Teams免费版。Teams在实时字幕领域不仅继承了Skype原有技术积累,还开发了超过27种语言的实时语音转文字字幕,且字幕可在会议结束后自动保存为完整会议摘要。
底层技术架构的演进
在技术底层,Skype Translator使用了基于神经网络的机器翻译技术,这种技术能够自动学习和理解语言的结构和语义,从而实现更准确和自然的翻译。微软宣称其机器学习模型在日常对话场景下准确率约85%,专业术语场景略有下降。随着模型迭代,准确率在停服前已有所提升。2026年,Microsoft Teams仍在继续优化相关模型。
2025年7月,微软为Skype发布了新的AI体验,支持自动检测不同的语言,并根据需要为用户和通话中的其他人自动启动音频和文本翻译。2026年5月6日,微软宣布Skype的实时翻译功能使用AI技术自动检测视频通话中使用的语言并进行实时翻译,结合了语音识别和自然语言处理技术的优势。
但这些更新已无缘在Skype网页版上体验——它们直接出现在Teams的实时字幕功能路线图中。
结语
Skype网页版实时字幕功能耗时七年,走过了从少数语言的翻译器测试到90种以上语言的广泛支持、从手动选择到自动检测的完整演进。每一次迭代都不断向“消除语言障碍,让沟通无障碍”这个目标靠近。即使Skype网页版已经停服,其技术积累仍深植于Teams的基因中。
当你下一次在Teams中开启实时字幕,与海外客户畅通交流时,屏幕底下缓缓滚动的文字背后,是一条延续近十年的技术演进之路。