我在callcenter里面要结合asr用。客户的通话录音不可能只有60秒，而且这边好像只能单声道，

（图片来源网络，侵删）

1. 录音长度问题

虽然一些在线的ASR服务有60秒的限制，但在呼叫中心环境中，客户的通话录音通常会更长，这意味着你需要一个能够处理长时间录音的ASR解决方案，许多专业的ASR解决方案都可以处理长时间录音，包括Google的语音到文本API、IBM Watson、Microsoft Azure等。

2. 单声道问题

大多数现代的ASR系统都支持立体声或单声道音频，如果你的录音只有单声道，这通常不会对ASR的效果产生太大影响，如果录音的质量很差（有很多背景噪音），那么可能会影响ASR的准确性。

3. 解决方案

以下是一些可能的解决方案：

3.1 Google语音到文本API

Google语音到文本API可以处理长时间的录音，并且支持多种语言和方言，你可以将录音文件上传到Google Cloud Storage，然后使用API将其转换为文本。

3.2 IBM Watson

IBM Watson也提供了一个功能强大的ASR服务，可以处理长时间的录音，并支持多种语言和方言，你可以将录音文件上传到IBM Cloud，然后使用Watson ASR将其转换为文本。

3.3 Microsoft Azure

Microsoft Azure也提供了一个名为"Bing Speech"的ASR服务，可以处理长时间的录音，并支持多种语言和方言，你可以将录音文件上传到Azure，然后使用Bing Speech将其转换为文本。

4. 上文归纳

在选择ASR解决方案时，你需要考虑你的具体需求，包括你需要处理的录音的长度、质量、语言和方言等因素，你还需要考虑你的预算，因为一些ASR服务可能需要付费，你还需要考虑你的技术能力，因为一些ASR解决方案可能需要一些编程知识才能使用。

原创文章，作者：未希，如若转载，请注明出处：https://www.kdun.com/ask/533087.html

本网站发布或转载的文章及图片均来自网络，其原创性以及文中表达的观点和判断不代表本网站。如有问题，请联系客服处理。