TAGS / TERM

TTS

共 51 篇

Kokoro语音合成：本地高效高质量TTS 2026-07-07 · HACKER_NEWS
Gemini 3.1 Flash TTS细粒度音频标签提升语音表现力 2026-04-16 · BLOGS_PODCASTS
Gemini 3.1 Flash TTS: the next generation of expressive 2026-04-15 · BLOGS_PODCASTS
Kitten TTS 三款新模型：小体积低于 25MB 2026-03-19 · HACKER_NEWS
TADA：通过文本-声学同步实现快速可靠的语音生成 2026-03-11 · HACKER_NEWS
TADA：通过文本-声学同步实现快速可靠的语音生成 2026-03-11 · HACKER_NEWS
TADA：通过文本-声学同步实现快速可靠的语音生成 2026-03-11 · HACKER_NEWS
Granite 4.0 1B语音模型：轻量级多语言边缘部署方案 2026-03-10 · BLOGS_PODCASTS
Granite 4.0 1B 语音模型：轻量化多语言边缘部署 2026-03-10 · BLOGS_PODCASTS
Granite 4.0 1B语音模型：紧凑、多语言、面向边缘端 2026-03-10 · BLOGS_PODCASTS
Descript利用OpenAI模型实现多语种视频规模化配音 2026-03-10 · BLOGS_PODCASTS
Granite 4.0 1B语音模型：轻量多语言适配边缘端 2026-03-10 · BLOGS_PODCASTS
Granite 4.0 10亿参数语音模型：紧凑、多语言与边缘部署 2026-03-10 · BLOGS_PODCASTS
Granite 4.0 1B语音模型：轻量多语言与边缘部署优化 2026-03-10 · BLOGS_PODCASTS
Descript 利用 OpenAI 模型实现大规模多语言视频配音 2026-03-10 · BLOGS_PODCASTS
Granite 4.0 1B 语音模型：紧凑、多语言、适配边缘端 2026-03-09 · BLOGS_PODCASTS
Descript利用OpenAI模型优化多语言视频配音的语义与时机 2026-03-09 · BLOGS_PODCASTS
Descript利用OpenAI模型优化语义与时机实现大规模多语言视频配音 2026-03-09 · BLOGS_PODCASTS
Descript利用OpenAI模型实现大规模多语言视频配音 2026-03-09 · BLOGS_PODCASTS
Descript 利用 OpenAI 模型优化多语言视频配音的语义与时序 2026-03-08 · BLOGS_PODCASTS
Descript 集成 OpenAI 模型实现多语言视频批量配音 2026-03-07 · BLOGS_PODCASTS
Descript 利用 OpenAI 模型优化多语种视频配音的节奏与自然度 2026-03-07 · BLOGS_PODCASTS
谷歌二月发布Gemini 3.1 Pro与Nano Banana 2 2026-03-07 · BLOGS_PODCASTS
Descript 利用 OpenAI 模型实现规模化多语言视频配音 2026-03-06 · BLOGS_PODCASTS
从零构建延迟低于500毫秒的语音智能体 2026-03-03 · HACKER_NEWS
从零构建延迟低于500ms的语音智能体 2026-03-03 · HACKER_NEWS
从零构建延迟低于500毫秒的语音智能体 2026-03-03 · HACKER_NEWS
面向智能体的音频工具包 2026-03-01 · HACKER_NEWS
面向低延迟口语对话的语篇感知双流响应生成 2026-02-27 · ARXIV
小实验室在音频领域取得领先优势 2026-02-16 · HACKER_NEWS
小实验室在音频领域取得领先优势 2026-02-16 · HACKER_NEWS
电台主播指控谷歌NotebookLM语音克隆功能窃取其声音 2026-02-16 · HACKER_NEWS
UniT：统一多模态思维链测试时扩展方法 2026-02-16 · ARXIV
PageLM：开源AI教育平台，将文档转化为测验与播客 2026-02-16 · JUEJIN
音频领域成为小型实验室实现技术突破的主战场 2026-02-15 · HACKER_NEWS
PageLM：开源AI教育平台，将文档转为测验与播客 2026-02-15 · JUEJIN
PageLM：开源 AI 学习平台，将文档转化为测验与播客 2026-02-15 · JUEJIN
PageLM：开源AI教育平台，将PDF文档转化为测验与播客 2026-02-15 · JUEJIN
UniT：统一多模态思维链测试时扩展 2026-02-14 · ARXIV
UniT：统一多模态思维链测试时扩展方法 2026-02-13 · ARXIV
Amazon Nova Sonic 实时语音助手与级联架构对比 2026-02-12 · BLOGS_PODCASTS
训练900万参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
训练 9M 参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
Show HN：我用9M参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
训练9M参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
Show HN: 训练900万参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
训练9M参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
训练900万参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
训练9M参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS
Show HN：我用9M参数语音模型修正普通话声调 2026-01-31 · HACKER_NEWS