2025年10月21日——人工智能语音技术公司 Fish Audio 今日宣布其语音合成模型 S1 重大升级,全新版本仅需10秒参考音频,即可高保真克隆任意人声,显著提升语音定制的速度与精度。
此次升级后的 Fish Audio S1 支持多语种、多情感和多风格的语音复现,即使在极短样本条件下,也能精准捕捉说话者的音色、节奏与语调特征。该技术可广泛应用于有声读物、虚拟主播、游戏配音、个性化语音助手及无障碍辅助工具等领域。
Fish Audio 表示,新模型在保持低延迟的同时,大幅优化了抗噪能力和口音适应性,确保在真实场景中的稳定表现。开发者现可通过 Fish Audio 开放平台调用 S1 API,企业用户亦可申请私有化部署方案。
“让每个人的声音都能被高效、安全地复用,是我们不变的使命。”Fish Audio 创始人表示,“S1 的这次升级,是语音克隆从‘实验室’走向‘日常工具’的关键一步。”