微软Word推出语音文本转录功能对抗谷歌Docs
微软的Word转录功能能够在对话中检测不同的扬声器
微软的Word在网上已经增加了一个音频转录功能,让您轻松地生成您以前录制的对话的抄本,或实时转录正在进行的对话。这项名为Transcribe in Word的新功能使用Azure认知服务来帮助在微软Word的在线版本中直接提供转录,它能够检测不同的扬声器并为您提供带有时间戳的音频。微软的目标用户是记录采访的记者、学生以及记录焦点小组会议的研究人员,还有记录非正式讨论的秘书。
Transcribe in Word对所有微软365的订阅者免费开放,目前可以通过微软的Word在新的微软Edge或Chrome浏览器中访问网络,不过微软计划在今年年底之前将其推广到Android和iOS应用程序中。
在microsoftword的在线版本中,单击命令图标旁边的下拉按钮,然后选择Transcribe选项在Word中进行转录,这将带来一个侧边栏,允许您通过上传WAV、MP4或MP3格式的音频文件来生成文本,或者直接在文字处理程序中开始录制对话。对于上传的录音,每个月有5小时或300分钟的限制——每个上传的录音的大小不超过200MB,但是如果你使用内置的音频录制选项来转录对话,情况就不是这样了。
微软通过Azure认知服务使用人工智能(AI)来实现单词的转录,然而,它不像一个常规的语音识别程序,它能够在一次对话中检测多个说话者,用户还可以选择通过带时间戳的音频重新访问他们的部分录音,还可以选择手动编辑文本,以帮助在Microsoft Word中进行更改,一旦您完成了转录,您可以通过单击转录工具条中的“添加所有到文档”按钮将转录的文本添加到Word文档中。
微软最初启用了Transcribe in Word in English (EN-US)功能,不过考虑到该公司在启用其他语言的经验方面的成功,它将在未来支持其他一些语言。
Transcribe in Word的到来可以帮助微软吸引记者、学生和研究人员,他们积极地寻找一个完美的解决方案来转录对话,这可能会给在在线文字处理领域占据主导地位的谷歌Docs带来一场硬仗。此外,由于微软365的订阅用户有转录支持,雷德蒙德公司给像Otter这样的公司制造了麻烦,人工智能是目前为止在使用人工智能和机器学习算法生成书面转录领域很流行的一种人工智能。
值得注意的是,Transcribe in Word并不是微软为用户提供转录功能的第一步,事实上该公司已经在语音到文本的开发上工作了很长一段时间,早在2018年该公司就展示了使用Azure语音服务和锥形硬件的高级语音识别的初始模型,并于去年宣布会话转录服务作为其设备不可知的会议实时对话模型。
在带来转录支持的同时,微软已经提升了它的命令功能上的字与网络语音命令,这个新添加的功能允许用户通过“开始列表”或“最后一句话加粗”等命令来修改文档而不需要使用键盘,你也可以使用语音命令来添加符号,如“&”或“百分号”,或者添加标点符号,如省略号,自然地称它们为“点,点,点”,此外,语音命令还可以用来给你的信息添加表情符号。
口述语音命令最初可以通过网络和办公移动应用程序的Word访问,不过微软将在今年年底为所有微软365的用户提供语音指令,包括Word桌面和Mac应用程序的Word。