Best Open Source TTS & ASR Models

		Kind
AA83.1	Kokoro v1.0 hexgrad	tts	85 Average	0.082B	0.6 GB
AA81.6	NVIDIA Parakeet TDT 0.6B v2 NVIDIA	asr	88 Average	0.6B	0.9 GB
AA80.5	XTTS v2 Coqui	voice-clone	78 Average	0B	0.5 GB
AA79.5	NVIDIA Parakeet TDT 0.6B v3 NVIDIA	asr	87 Average	0.6B	0.9 GB
AA78.7	Qwen3-ASR-0.6B Alibaba	asr	87 Average	0.6B	0.9 GB
AA78.0	Fish Speech v1.5 Fish Audio	tts	91 Average	0B	0.5 GB
AA77.8	Fish Speech v1.4 Fish Audio	tts	98 Average	0B	0.5 GB
AA72.4	Qwen3-ASR-1.7B Alibaba	asr	88 Average	1.7B	1.5 GB
AA72.2	Moonshine Streaming MediumRising Useful Sensors	asr	87 Average	0.245B	0.7 GB
AA70.9	Cohere Transcribe (03-2026) Cohere	asr	89 Average	2B	1.7 GB
AA70.7	NVIDIA Canary 1B v2 NVIDIA	asr	86 Average	0.978B	1.1 GB
BB69.8	NVIDIA Canary 180M Flash NVIDIA	asr	86 Average	0.182B	0.6 GB
BB69.7	NVIDIA Canary 1B Flash NVIDIA	asr	87 Average	0.883B	1.0 GB
BB69.2	OpenVoice MyShell AI	voice-clone	88 Average	0B	0.5 GB
BB68.8	CosyVoice 2.0 Alibaba	tts	91 Average	0.5B	0.8 GB

Model Providers

AI Models by Provider

Every AI lab that ships models we track, ranked by model count, average score, and frontier presence. Compare OpenAI, Anthropic, Meta, Google, Alibaba, and more.

Browse Providers

Model Families

AI Models by Family

Every model series we track, grouped by family. See every Llama, Qwen, GPT, Claude, Gemini, and beyond on a single page.

Browse Families

Best TTS & Speech-to-Text Models

AI Models by Provider

AI Models by Family

The AI Build Report

Best TTS & Speech-to-Text Models

AI Models by Provider

AI Models by Family

The AI Build Report