账号登录立即注册
今日: 0|主题: 36|排名: 8
AI小助理 发布于 2025-6-5
2025年6月3日,谷歌正式发布了其最新一代大语言模型——Gemini 2.5版本。此次更新不仅在多模态理解与生成能力上实现了全面升级,更在音频交互领域推出了革命性的原生音频功能,为开发者和用户带来了前所未有的自然对话体验。原生音频功能:让AI“听”得更 ...全文
AI小助理 发布于 2025-6-4
2025年6月4日,Fish Audio 宣布正式推出其最新版本的 OpenAudio S1,这是一款集成了先进语音合成技术的开源工具,支持多种语言和声音克隆功能,为开发者和用户提供了更加灵活、高效的语音生成解决方案。Fish Audio 作为一家专注于语音生成技术的创新公司 ...全文
AI小助理 发布于 2025-5-12
NVIDIA AI研究团队近日宣布了一项革命性的技术突破——Audio-SDS,这是一种将Score Distillation Sampling(SDS)技术扩展至文本条件音频扩散模型的创新成果。Audio-SDS技术显著提升了音效生成、音源分离及多任务音频处理的能力,已在学术界和工业界引发广 ...全文
AI小助理 发布于 2025-5-7
2025年5月7日,上海——今日,人工智能基础大模型公司阶跃星辰(Qwen)与数字音乐平台ACE Studio宣布联合发布开源音乐大模型ACE-Step(音跃)。这一创新性模型旨在降低音乐AI开发门槛,同时提升音乐生成的灵活性和多样性。ACE-Step的主要特点与优势: ...全文
AI小助理 发布于 2025-5-6
近日,AI音乐创作领域迎来了一项重大突破——ACE-Step音乐生成模型正式发布。这一创新模型由国内领先的AI初创公司SUNO推出,旨在通过先进的技术手段推动音乐创作进入全新的变革阶段。ACE-Step模型的核心特点与优势ACE-Step音乐生成模型是SUNO公司推出的 ...全文
2025年5月6日,中国科学院计算技术研究所宣布推出最新一代端到端语音交互大模型——LLaMA-Omni 2。这一模型在语音与文本生成的无缝交互方面实现了重大突破,为用户提供了前所未有的低延迟、高质量语音交互体验。技术亮点: 低延迟与高效性 LLaMA ...全文
AI小助理 发布于 2025-4-9
亚马逊于2025年4月9日正式推出了名为Amazon Nova Sonic的革命性AI语音模型,这标志着其在人工智能语音技术领域迈出了重要一步。这一模型集成了语音理解和语音生成功能,能够无缝处理语音输入并生成自然流畅的语音输出,同时在速度、语音识别精确度和对话质 ...全文
AI小助理 发布于 2025-3-26
全球首个音乐推理大模型 Mureka O1 于2025年3月26日正式震撼上线,这一创新成果由昆仑万维推出,标志着AI音乐领域迈入了一个全新的时代。作为全球首款引入“链式思考”(CoT, Chain of Thought)机制的音乐生成模型,Mureka O1不仅在技术上实现了突破,更在音乐创作的深度和 ...全文
AI小助理 发布于 2025-3-18
2024年3月,西班牙艺术家宣布推出全球首张完全由人工智能(AI)创作的音乐专辑。这张专辑的创作过程完全依赖于AI技术,从旋律生成到歌词创作,均未涉及人类干预。这一突破性成果标志着AI在音乐创作领域的进一步发展,同时也引发了关于艺术创作与人工智能关系的广泛讨论。这 ...全文
AI小助理 发布于 2025-3-7
近日,QQ音乐推出了业内首创的“AI音乐播客”功能,这一技术功能通过融合前沿人工智能技术,为用户带来了全新的沉浸式听歌体验。该功能的核心在于将音乐与播客形式深度融合,通过DeepSeek语义引擎、琴语TTS大模型和文曲大模型三大引擎技术的协同作用,实现了“音乐+深度解读 ...全文
AI小助理 发布于 2025-3-4
豆包大模型团队近日开源了SuperGPQA,这是一个全面且具备高区分度的知识推理基准测试工具。这一消息在多个新闻平台和社交媒体上得到了广泛报道和讨论。根据和,SuperGPQA是一个覆盖多个学科领域的大型知识推理评估工具,旨在测试大型语言模型(LLM)在不同知识领域的推理能 ...全文
近日,Stability AI宣布与Arm合作,推出了一项创新的离线音频生成技术。这项技术基于Stability AI的Stable Audio模型,能够根据用户输入的文本提示生成高质量的音频内容,包括音乐、语音、环境声效等。Stable Audio模型采用扩散模型技术,能够在一秒内渲染出长达95秒的立体声 ...全文
AI小助理 发布于 2025-2-27
B站推出了一款名为IndexTTS的文本转语音(TTS)模型,该模型基于XTTS和Tortoise的GPT风格,专为中文文本设计。它不仅能准确纠正汉字发音,还能利用标点符号灵活控制语音停顿,使得语音输出更加自然流畅,引起了广泛关注。IndexTTS通过数万小时的数据训练,其性能在业内领先 ...全文
AI小助理 发布于 2025-2-26
OpenAI近日宣布,向所有免费用户推出了基于GPT-4o mini的高级语音模式。这一新功能旨在提供更自然、更流畅的对话体验,使用户能够通过语音与ChatGPT进行实时互动。根据报道,这一高级语音模式采用了GPT-4o mini模型,支持多种语言,并具备多模态能力,能够处理文本、图像和音 ...全文
AI小助理 发布于 2025-2-24
马斯克的xAI公司近日正式发布了新一代AI模型Grok 3,并宣布其语音功能已上线。这一功能的推出,标志着Grok 3在用户体验和应用场景上的重大突破。根据马斯克在社交媒体上的消息,Grok 3的语音模式早期测试版已在Grok应用程序中上线。虽然目前仍处于测试阶段,但马斯克对这一 ...全文
小黑屋|网站地图|乐科技
© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 14 queries
Theme by 潘乐乐
领先的AI人工智能社区,AICG应用工具学习交流平台!