Pocket-TTS

Running

App Files Files Community

Pocket-TTS

Commit History

Add utility scripts: voice tools, chunking, batch generation, space restart

7135eb0

Running

hf4uwho commited on May 12

Upload voices/celeb/joe_pesci.wav with huggingface_hub

5f68145
verified

hf4uwho commited on May 11

Upload voices/celeb/jack_nicholson.wav with huggingface_hub

1f982cc
verified

hf4uwho commited on May 11

Upload scripts/voice.py with huggingface_hub

c762a43
verified

hf4uwho commited on May 11

Upload samples/jack_nicholson_story.ogg with huggingface_hub

b011c43
verified

hf4uwho commited on May 11

Upload samples/scarlett_johansson_story.ogg with huggingface_hub

a5794f5
verified

hf4uwho commited on May 11

Add sample stories text + update README with celeb voices section

ac9c995

hf4uwho commited on May 11

Replace jack_nicholson and joe_pesci voice references

e0f3dd5

hf4uwho commited on May 11

Replace celeb voice references with proper clips

50f682a

hf4uwho commited on May 11

Add 7 celebrity voices: DiCaprio, Nicholson, Pesci, De Niro, Pacino, Gyllenhaal, Johansson

341df3d

hf4uwho commited on May 11

Add POST /tts endpoint — no URL length limits, send full text in body

1334893

hf4uwho commited on May 11

Revert to one-shot generation. Chunked crossfade didn't fix stuttering.

d65d8c9

hf4uwho commited on May 10

Chunked TTS: split long text into sentences, generate each, crossfade joins to remove abrupt cuts

7be824c

hf4uwho commited on May 10

Add 588 voices from kyutai/tts-voices. Total: 665 voices.

e58e7aa

hf4uwho commited on May 10

Comprehensive README: API docs, 78 voices, architecture, and full debugging notes

d5bd886

hf4uwho commited on May 10

Add 24 character voices from chandypants/ollie-pocket-tts (78 total)

24c96a2

hf4uwho commited on May 10

FIX: use get_state_for_audio_prompt from Nymbo WAV files (actually produces speech)

721b988

hf4uwho commited on May 10

FIX: load english_2026-04 model WITH voice cloning (default loads without-voice-cloning = noise)

8674286

hf4uwho commited on May 10

Fix: convert flat v3/v2 safetensors keys to nested dict format for voice state

da26835

hf4uwho commited on May 10

Fix: handle v3/v2 pre-computed KV cache embeddings (no audio_prompt key)

c76f7f1

hf4uwho commited on May 10

Add verbose logging for embedding download failures

706bbf0

hf4uwho commited on May 10

Fix: pass HF_TOKEN to huggingface_hub for gated model embedding download

d343afd

hf4uwho commited on May 10

Switch to Docker SDK: FastAPI server with direct WAV/OGG output, no Gradio

1dd1d1c

hf4uwho commited on May 10

Update app.py

4242e3c
verified

Nymbo commited on Jan 19

Update app.py

a1edee3
verified

Nymbo commited on Jan 19

Upload 108 files

4c61103
verified

Nymbo commited on Jan 19

Delete voices/af_sky.mp3

883fd16
verified

Nymbo commited on Jan 19

Delete voices/af_heart.mp3

4d6ed99
verified

Nymbo commited on Jan 19

Update README.md

ad9ea82
verified

Nymbo commited on Jan 19

Update app.py

861f2cc
verified

Nymbo commited on Jan 19

Update README.md

4dea557
verified

Nymbo commited on Jan 19

Update app.py

0907a02
verified

Nymbo commited on Jan 19

Update README.md

77dfc08
verified

Nymbo commited on Jan 19

Update README.md

5492fcb
verified

Nymbo commited on Jan 19

Update app.py

9b5ff2e
verified

Nymbo commited on Jan 19

Update app.py

d07589f
verified

Nymbo commited on Jan 19

Update app.py

a23619f
verified

Nymbo commited on Jan 19

Upload 2 files

4d21128
verified

Nymbo commited on Jan 19

Create app.py

b0e1ce1
verified

Nymbo commited on Jan 19

Create requirements.txt

9ec85a2
verified

Nymbo commited on Jan 19

Update README.md

20b63d2
verified

Nymbo commited on Jan 19

initial commit

f944d36
verified

Nymbo commited on Jan 19

Commit History

Add utility scripts: voice tools, chunking, batch generation, space restart 7135eb0 Running

Upload voices/celeb/joe_pesci.wav with huggingface_hub 5f68145 verified

Upload voices/celeb/jack_nicholson.wav with huggingface_hub 1f982cc verified

Upload scripts/voice.py with huggingface_hub c762a43 verified

Upload samples/jack_nicholson_story.ogg with huggingface_hub b011c43 verified

Upload samples/scarlett_johansson_story.ogg with huggingface_hub a5794f5 verified

Add sample stories text + update README with celeb voices section ac9c995

Replace jack_nicholson and joe_pesci voice references e0f3dd5

Replace celeb voice references with proper clips 50f682a

Add 7 celebrity voices: DiCaprio, Nicholson, Pesci, De Niro, Pacino, Gyllenhaal, Johansson 341df3d

Add POST /tts endpoint — no URL length limits, send full text in body 1334893

Revert to one-shot generation. Chunked crossfade didn't fix stuttering. d65d8c9

Chunked TTS: split long text into sentences, generate each, crossfade joins to remove abrupt cuts 7be824c

Add 588 voices from kyutai/tts-voices. Total: 665 voices. e58e7aa

Comprehensive README: API docs, 78 voices, architecture, and full debugging notes d5bd886

Add 24 character voices from chandypants/ollie-pocket-tts (78 total) 24c96a2

FIX: use get_state_for_audio_prompt from Nymbo WAV files (actually produces speech) 721b988

FIX: load english_2026-04 model WITH voice cloning (default loads without-voice-cloning = noise) 8674286

Fix: convert flat v3/v2 safetensors keys to nested dict format for voice state da26835

Fix: handle v3/v2 pre-computed KV cache embeddings (no audio_prompt key) c76f7f1

Add verbose logging for embedding download failures 706bbf0

Fix: pass HF_TOKEN to huggingface_hub for gated model embedding download d343afd

Switch to Docker SDK: FastAPI server with direct WAV/OGG output, no Gradio 1dd1d1c

Update app.py 4242e3c verified

Update app.py a1edee3 verified

Upload 108 files 4c61103 verified

Delete voices/af_sky.mp3 883fd16 verified

Delete voices/af_heart.mp3 4d6ed99 verified

Update README.md ad9ea82 verified

Update app.py 861f2cc verified

Update README.md 4dea557 verified

Update app.py 0907a02 verified

Update README.md 77dfc08 verified

Update README.md 5492fcb verified

Update app.py 9b5ff2e verified

Update app.py d07589f verified

Update app.py a23619f verified

Upload 2 files 4d21128 verified

Create app.py b0e1ce1 verified

Create requirements.txt 9ec85a2 verified

Update README.md 20b63d2 verified

initial commit f944d36 verified

Add utility scripts: voice tools, chunking, batch generation, space restart

7135eb0

Running

Upload voices/celeb/joe_pesci.wav with huggingface_hub

5f68145
verified

Upload voices/celeb/jack_nicholson.wav with huggingface_hub

1f982cc
verified

Upload scripts/voice.py with huggingface_hub

c762a43
verified

Upload samples/jack_nicholson_story.ogg with huggingface_hub

b011c43
verified

Upload samples/scarlett_johansson_story.ogg with huggingface_hub

a5794f5
verified

Add sample stories text + update README with celeb voices section

ac9c995

Replace jack_nicholson and joe_pesci voice references

e0f3dd5

Replace celeb voice references with proper clips

50f682a

Add 7 celebrity voices: DiCaprio, Nicholson, Pesci, De Niro, Pacino, Gyllenhaal, Johansson

341df3d

Add POST /tts endpoint — no URL length limits, send full text in body

1334893

Revert to one-shot generation. Chunked crossfade didn't fix stuttering.

d65d8c9

Chunked TTS: split long text into sentences, generate each, crossfade joins to remove abrupt cuts

7be824c

Add 588 voices from kyutai/tts-voices. Total: 665 voices.

e58e7aa

Comprehensive README: API docs, 78 voices, architecture, and full debugging notes

d5bd886

Add 24 character voices from chandypants/ollie-pocket-tts (78 total)

24c96a2

FIX: use get_state_for_audio_prompt from Nymbo WAV files (actually produces speech)

721b988

FIX: load english_2026-04 model WITH voice cloning (default loads without-voice-cloning = noise)

8674286

Fix: convert flat v3/v2 safetensors keys to nested dict format for voice state

da26835

Fix: handle v3/v2 pre-computed KV cache embeddings (no audio_prompt key)

c76f7f1

Add verbose logging for embedding download failures

706bbf0

Fix: pass HF_TOKEN to huggingface_hub for gated model embedding download

d343afd

Switch to Docker SDK: FastAPI server with direct WAV/OGG output, no Gradio

1dd1d1c

Update app.py

4242e3c
verified

Update app.py

a1edee3
verified

Upload 108 files

4c61103
verified

Delete voices/af_sky.mp3

883fd16
verified

Delete voices/af_heart.mp3

4d6ed99
verified

Update README.md

ad9ea82
verified

Update app.py

861f2cc
verified

Update README.md

4dea557
verified

Update app.py

0907a02
verified

Update README.md

77dfc08
verified

Update README.md

5492fcb
verified

Update app.py

9b5ff2e
verified

Update app.py

d07589f
verified

Update app.py

a23619f
verified

Upload 2 files

4d21128
verified

Create app.py

b0e1ce1
verified

Create requirements.txt

9ec85a2
verified

Update README.md

20b63d2
verified

initial commit

f944d36
verified