ElevenLabs最新实时语音转文本模型:Scribe v2 Realtime,150毫秒转录90+种语言
可以用于语音助手、会议记录或者实时应用程序等等 英语、日语等的WER≤5% ,中文普通话>5% ≤10%
文档:https://elevenlabs.io/docs/capabilities/speech-to-text
cWq8MCUxcGaCv86J.mp4