【[191星]delayed-streams-modeling:实时语音转文字的高效解决方案。亮点:1. 实时流式推理,延迟低至0.5秒;2. 高效批处理,H100可实时处理400个流;3. 提供单词级时间戳和语义VAD,助力语音Agent开发】
'delayed-streams-modeling: Instructions and examples of how to run Kyutai Speech-To-Text models powered by delayed streams modeling (DSM)'
GitHub: github.com/kyutai-labs/delayed-streams-modeling
语音转文字 实时处理 多语言支持 人工智能 ai兴趣创作计划