目录
TTS
条目:49
2026年四月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 1min | mic
Gemini 3.1 Flash TTS: the next generation of expressive 04-15
TTS
语音合成
AI语音 |
2026年三月
25 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 3min | newspaper
Kitten TTS 三款新模型:小体积低于 25MB 03-19
TTS
语音合成
小体积 |
[自动]
[HACKER_NEWS] | 2min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[HACKER_NEWS] | 1min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[HACKER_NEWS] | 1min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B语音模型:轻量级多语言边缘部署方案 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B 语音模型:轻量化多语言边缘部署 03-10
Granite 4.0
语音模型
边缘部署 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B语音模型:紧凑、多语言、面向边缘端 03-10
Granite
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Descript利用OpenAI模型实现多语种视频规模化配音 03-10
OpenAI
语音合成
多语种 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 1B语音模型:轻量多语言适配边缘端 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 10亿参数语音模型:紧凑、多语言与边缘部署 03-10
Granite 4.0
语音模型
边缘部署 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Granite 4.0 1B语音模型:轻量多语言与边缘部署优化 03-10
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Descript 利用 OpenAI 模型实现大规模多语言视频配音 03-10
OpenAI
视频配音
多语言 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Granite 4.0 1B 语音模型:紧凑、多语言、适配边缘端 03-09
Granite 4.0
语音模型
边缘计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Descript利用OpenAI模型优化多语言视频配音的语义与时机 03-09
Descript
OpenAI
多语言配音 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Descript利用OpenAI模型优化语义与时机实现大规模多语言视频配音 03-09
Descript
OpenAI
视频配音 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Descript利用OpenAI模型实现大规模多语言视频配音 03-09
Descript
OpenAI
视频配音 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Descript 利用 OpenAI 模型优化多语言视频配音的语义与时序 03-08
OpenAI
视频配音
多语言 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Descript 集成 OpenAI 模型实现多语言视频批量配音 03-07
Descript
OpenAI
视频配音 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Descript 利用 OpenAI 模型优化多语种视频配音的节奏与自然度 03-07
OpenAI
视频配音
多语种 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
谷歌二月发布Gemini 3.1 Pro与Nano Banana 2 03-07
Google
Gemini 1.5 Pro
Gemini Nano |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Descript 利用 OpenAI 模型实现规模化多语言视频配音 03-06
OpenAI
语音合成
多语言配音 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从零构建延迟低于500毫秒的语音智能体 03-03
语音智能体
低延迟
实时语音 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从零构建延迟低于500ms的语音智能体 03-03
语音智能体
低延迟
实时交互 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从零构建延迟低于500毫秒的语音智能体 03-03
语音智能体
低延迟
实时交互 |
[自动]
[HACKER_NEWS] | 1min | newspaper
面向智能体的音频工具包 03-01
Agent
Audio
TTS |
2026年二月
13 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
面向低延迟口语对话的语篇感知双流响应生成 02-27
DDTSR
低延迟
口语对话 |
[自动]
[HACKER_NEWS] | 3min | newspaper
小实验室在音频领域取得领先优势 02-16
音频生成
小模型
AI初创 |
[自动]
[HACKER_NEWS] | 3min | newspaper
小实验室在音频领域取得领先优势 02-16
音频生成
小实验室
AI 竞争 |
[自动]
[HACKER_NEWS] | 4min | newspaper
电台主播指控谷歌NotebookLM语音克隆功能窃取其声音 02-16
NotebookLM
谷歌
语音克隆 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-16
多模态
思维链
测试时扩展 |
[自动]
[JUEJIN] | 2min | sticky_note_2
PageLM:开源AI教育平台,将文档转化为测验与播客 02-16
PageLM
AI教育
NotebookLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
音频领域成为小型实验室实现技术突破的主战场 02-15
音频生成
AI音乐
语音合成 |
[自动]
[JUEJIN] | 2min | sticky_note_2
PageLM:开源AI教育平台,将文档转为测验与播客 02-15
PageLM
NotebookLM
AI教育 |
[自动]
[JUEJIN] | 2min | sticky_note_2
PageLM:开源 AI 学习平台,将文档转化为测验与播客 02-15
PageLM
AI 教育
NotebookLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
PageLM:开源AI教育平台,将PDF文档转化为测验与播客 02-15
PageLM
AI教育
NotebookLM |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展 02-14
多模态
思维链
测试时扩展 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-13
多模态
思维链
测试时扩展 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Amazon Nova Sonic 实时语音助手与级联架构对比 02-12
Amazon Nova
语音助手
实时语音 |
2026年一月
10 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 4min | newspaper
训练900万参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练 9M 参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Show HN:我用9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Show HN: 训练900万参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练900万参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Show HN:我用9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
[自动]
[HACKER_NEWS] | 4min | newspaper
训练9M参数语音模型修正普通话声调 01-31
语音模型
普通话
声调修正 |
无匹配条目