Whisper是OpenAI推出的自动语音识别(ASR)系统,使用从网络收集的 680,000 小时多语言和多任务监督数据进行训练。
详细介绍:https://openai.com/research/whisper
论文:https://cdn.openai.com/papers/whisper.pdf
开源代码:https://github.com/openai/whisper
使用地址:https://platform.openai.com/playground
米可智能 – 音视频语音翻译AI工具
Voice Changer-ElevenLabs推出的AI语音转换工具
Amphion-香港中文大学开源的音频、音乐和语音生成工具包
HitPaw: 一站式AI音频、视频和照片工具
Notta:高效智能的音频转文字工具