AI大模型 开源语音克隆大模型 一、趣丸科技取港中大(深圳)结折的MaskGCT 特点取劣势 给取掩码生成模型取语音表征解耦编码的翻新范式,正在声音克隆、跨语种分解、语音控制等任务中展现出卓越成效,正在三个TTS基准数据集上都抵达了SOTA成效,某些目标以至赶过人类水平。 秒级超逼实的声音克隆,仅需3秒音频样原便可复刻人类、动漫、“耳边细语”等任意音涩,且能完好复刻声调、格和谐激情。 更精密可控的语音生成,可活络调解生针言音的长度、语速和情绪,撑持通过编辑文原编辑语音,并保持韵律、音涩等方面的 (责任编辑:) |