terminal

AI Stack

rss_feed
SYS_STABLE
目录

TTS

条目:49
2026年四月 1 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
1minmic Gemini 3.1 Flash TTS: the next generation of expressive
04-15 TTS 语音合成 AI语音
2026年三月 25 篇
类型阅读条目
[自动] [HACKER_NEWS]
3minnewspaper Kitten TTS 三款新模型:小体积低于 25MB
03-19 TTS 语音合成 小体积
[自动] [HACKER_NEWS]
2minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [HACKER_NEWS]
1minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [HACKER_NEWS]
1minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [BLOGS_PODCASTS]
2minmic Granite 4.0 1B语音模型:轻量级多语言边缘部署方案
03-10 Granite 4.0 语音模型 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Granite 4.0 1B 语音模型:轻量化多语言边缘部署
03-10 Granite 4.0 语音模型 边缘部署
[自动] [BLOGS_PODCASTS]
2minmic Granite 4.0 1B语音模型:紧凑、多语言、面向边缘端
03-10 Granite 语音模型 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Descript利用OpenAI模型实现多语种视频规模化配音
03-10 OpenAI 语音合成 多语种
[自动] [BLOGS_PODCASTS]
3minmic Granite 4.0 1B语音模型:轻量多语言适配边缘端
03-10 Granite 4.0 语音模型 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Granite 4.0 10亿参数语音模型:紧凑、多语言与边缘部署
03-10 Granite 4.0 语音模型 边缘部署
[自动] [BLOGS_PODCASTS]
2minmic Granite 4.0 1B语音模型:轻量多语言与边缘部署优化
03-10 Granite 4.0 语音模型 边缘计算
[自动] [BLOGS_PODCASTS]
3minmic Descript 利用 OpenAI 模型实现大规模多语言视频配音
03-10 OpenAI 视频配音 多语言
[自动] [BLOGS_PODCASTS]
3minmic Granite 4.0 1B 语音模型:紧凑、多语言、适配边缘端
03-09 Granite 4.0 语音模型 边缘计算
[自动] [BLOGS_PODCASTS]
2minmic Descript利用OpenAI模型优化多语言视频配音的语义与时机
03-09 Descript OpenAI 多语言配音
[自动] [BLOGS_PODCASTS]
2minmic Descript利用OpenAI模型优化语义与时机实现大规模多语言视频配音
03-09 Descript OpenAI 视频配音
[自动] [BLOGS_PODCASTS]
3minmic Descript利用OpenAI模型实现大规模多语言视频配音
03-09 Descript OpenAI 视频配音
[自动] [BLOGS_PODCASTS]
3minmic Descript 利用 OpenAI 模型优化多语言视频配音的语义与时序
03-08 OpenAI 视频配音 多语言
[自动] [BLOGS_PODCASTS]
3minmic Descript 集成 OpenAI 模型实现多语言视频批量配音
03-07 Descript OpenAI 视频配音
[自动] [BLOGS_PODCASTS]
3minmic Descript 利用 OpenAI 模型优化多语种视频配音的节奏与自然度
03-07 OpenAI 视频配音 多语种
[自动] [BLOGS_PODCASTS]
2minmic 谷歌二月发布Gemini 3.1 Pro与Nano Banana 2
03-07 Google Gemini 1.5 Pro Gemini Nano
[自动] [BLOGS_PODCASTS]
3minmic Descript 利用 OpenAI 模型实现规模化多语言视频配音
03-06 OpenAI 语音合成 多语言配音
[自动] [HACKER_NEWS]
1minnewspaper 从零构建延迟低于500毫秒的语音智能体
03-03 语音智能体 低延迟 实时语音
[自动] [HACKER_NEWS]
1minnewspaper 从零构建延迟低于500ms的语音智能体
03-03 语音智能体 低延迟 实时交互
[自动] [HACKER_NEWS]
1minnewspaper 从零构建延迟低于500毫秒的语音智能体
03-03 语音智能体 低延迟 实时交互
[自动] [HACKER_NEWS]
1minnewspaper 面向智能体的音频工具包
03-01 Agent Audio TTS
2026年二月 13 篇
类型阅读条目
[自动] [ARXIV]
3minschool 面向低延迟口语对话的语篇感知双流响应生成
02-27 DDTSR 低延迟 口语对话
[自动] [HACKER_NEWS]
3minnewspaper 小实验室在音频领域取得领先优势
02-16 音频生成 小模型 AI初创
[自动] [HACKER_NEWS]
3minnewspaper 小实验室在音频领域取得领先优势
02-16 音频生成 小实验室 AI 竞争
[自动] [HACKER_NEWS]
4minnewspaper 电台主播指控谷歌NotebookLM语音克隆功能窃取其声音
02-16 NotebookLM 谷歌 语音克隆
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-16 多模态 思维链 测试时扩展
[自动] [JUEJIN]
2minsticky_note_2 PageLM:开源AI教育平台,将文档转化为测验与播客
02-16 PageLM AI教育 NotebookLM
[自动] [HACKER_NEWS]
4minnewspaper 音频领域成为小型实验室实现技术突破的主战场
02-15 音频生成 AI音乐 语音合成
[自动] [JUEJIN]
2minsticky_note_2 PageLM:开源AI教育平台,将文档转为测验与播客
02-15 PageLM NotebookLM AI教育
[自动] [JUEJIN]
2minsticky_note_2 PageLM:开源 AI 学习平台,将文档转化为测验与播客
02-15 PageLM AI 教育 NotebookLM
[自动] [JUEJIN]
2minsticky_note_2 PageLM:开源AI教育平台,将PDF文档转化为测验与播客
02-15 PageLM AI教育 NotebookLM
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展
02-14 多模态 思维链 测试时扩展
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-13 多模态 思维链 测试时扩展
[自动] [BLOGS_PODCASTS]
3minmic Amazon Nova Sonic 实时语音助手与级联架构对比
02-12 Amazon Nova 语音助手 实时语音
2026年一月 10 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper 训练900万参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练 9M 参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
3minnewspaper Show HN:我用9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper Show HN: 训练900万参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练900万参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper Show HN:我用9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正
[自动] [HACKER_NEWS]
4minnewspaper 训练9M参数语音模型修正普通话声调
01-31 语音模型 普通话 声调修正