AI语音生成提速40%！苹果公布PCG技术

Antutu •

2026-02-03 09:01:36

•

阅读

今日，根据外媒9to5Mac报道，苹果与特拉维夫大学联合发布了一项名为「原则性粗粒度」（PCG）的语音生成技术，旨在突破AI文本转语音（TTS）领域长期存在的速度瓶颈。

传统TTS依赖自回归模型逐个预测声学token，需严格匹配预设内容，导致生成效率受限，即使预测结果与预设差异微小且听觉无感，也会因「精确匹配」要求被系统拒绝。

为解决这一问题，研究团队提出将声学token按听觉效果相似性分组，形成「声学相似组」。系统不再要求单点精确匹配，转而允许预测结果落入正确相似组范围内即可通过验证，将验证机制从「单点校验」升级为「范围校验」，显著提升容错率。

实际应用中，PCG采用「投机解码」双模型架构：轻量级小模型快速生成候选token，大模型审核其是否属于正确相似组。这种分工既保留了小模型的速度优势，又通过大模型保障了输出质量。

实验表明，该技术使语音生成速度提升约40%，自然度评分达4.09（满分5分）。

极限测试中，91.4%的token被替换为同组其他token时，词错率仅增0.007，说话人相似度下降0.027，人耳几乎无法察觉差异。

PCG属于推理阶段优化，无需重新训练现有模型，仅需额外37MB内存存储相似组信息，具有高实用性和低部署成本。

原创文章，作者：MoFirLee，如若转载，请注明出处：http://www.antutu.com/doc/136193.htm

 2









今年发布！小米新品大爆发

« 上一篇 2026-02-03 08:44:11

1月安卓性价比榜：谁是你心目中的性价比之王？

2026-02-03 10:11:06 下一篇 »

相关推荐

3月iOS设备好评榜：iPhone 17 Pro Max被嫌弃

3月iOS设备性能榜：M4 iPad Air杀入前三！

2月安卓性价比榜：一千出头的REDMI Turbo 4杀疯了

2月安卓好评榜：努比亚Z80 Ultra再次卫冕

2月iOS设备好评榜：前三是老朋友

2月安卓性能榜：性能Ultra拿下榜首

登录后才能评论

发表

xxxxx

评论一下退出

评论列表 ( )

下载

安兔兔评测

安兔兔评测Android

2026.4.2 v11.1.1

评测包下载 3D包下载

x86包下载 3D Lite包下载

安兔兔AI评测Android

2026.1.13 v3.6.1

立即下载

安兔兔评测车机版Android

2026.2.12 v1.2.3

立即下载

安兔兔SSDWin

2019.11.6 v1.0.3

立即下载

安兔兔评测Win/Linux

2025.11.14 v2.0.0.1192

Window版 Linux版

安兔兔AI大模型评测Win

2025.10.20 v1.1.0.1103

立即下载

媒体:

抖音

公众号

视频号

B站

抖音官方账号

 返回
顶部