ElevenLabs最新实时语音转文本模型:Scribe v2 Realtime,150毫秒转录90+种语言

可以用于语音助手、会议记录或者实时应用程序等等 英语、日语等的WER≤5% ,中文普通话>5% ≤10%

文档:https://elevenlabs.io/docs/capabilities/speech-to-text

image.png

cWq8MCUxcGaCv86J.mp4