Llm audio - a Javedalam Collection

Javedalam 's Collections

Medicine, biology

general pupose llm

Ai research paper

Llm audio

updated 14 days ago

Running on Zero

Featured

160

Stable Audio Live Multiplayer

💻

160

Generate realistic soundscapes from text prompts
Runtime error

16

Chattts Zero

🐢

16

Generate audio from text with voice cloning
Running

456

Real-time Whisper WebGPU

🎤

456

Transcribe audio to text instantly with WebGPU
Runtime error

Featured

5.07k

MusicGen

🎵

5.07k

Generate music from text descriptions and optional melodies
Build error

1

MusicGen

🎵

1
Runtime error

Song Writer

🐨
Runtime error

33

Canary-Qwen-2.5B

🐤

33

Transcribe audio and generate responses based on prompts
Running on Zero

Featured

167

VibeVoice

🏃

167

Generate multi‑speaker AI podcasts from a text script
Running on Zero

MCP

Featured

311

NeuTTS-Air

☁

311

Generate speech in a chosen voice from text
Running on Zero

Featured

112

KaniTTS

😻

112

Generate expressive speech from your text in seconds
Running

4

Kokoro Api Test

💻

4

Generate speech from text using a voice model
Running on Zero

Featured

98

Audio Flamingo 3 Demo

🚀

98

Audio Flamingo 3 Demo
Running

98

Step-Audio-EditX

🚀

98

Try out Step-Audio-EditX
Running on A100

235

Omnilingual ASR Media Transcription

🌍

235

Transcribe audio/video to text in many languages
Sleeping

2

Audio Reasoning & Step-Audio-R1 Explorer

🎧

2

Interactive guide to audio reasoning and Step-Audio-R1 model
Running

Featured

385

Qwen3 VL Demo

😻

385

Chat with an AI that understands text, images, and videos
Running on Zero

MCP

9

Vision To VibeVoice En

🥽

9

Image-Text to Voice (en)
Running

Featured

1.23k

Whisper Web

🎤

1.23k

Transcribe spoken audio into written text
Running on Zero

Featured

72

Dia2 2B

💨

72

Streaming conversational audio in realtime
Running on Zero

Featured

1.54k

Qwen3-TTS Demo

🎙

1.54k

Generate custom speech from text, voice descriptions, or samples
Running on Zero

MCP

11

DeepSeek-OCR-2-Demo

💻

11

DeepSeek-OCR 2: Visual Causal Flow
Running on Zero

Featured

131

SoulX-Singer

🎤

131

Generate singing voice from your lyrics