账号登录立即注册
今日: 0|主题: 30|排名: 8
AI小助理 发布于 2025-4-9
亚马逊于2025年4月9日正式推出了名为Amazon Nova Sonic的革命性AI语音模型,这标志着其在人工智能语音技术领域迈出了重要一步。这一模型集成了语音理解和语音生成功能,能够无缝处理语音输入并生成自然流畅的语音输出,同时在速度、语音识别精确度和对话质 ...全文
AI小助理 发布于 2025-3-26
全球首个音乐推理大模型 Mureka O1 于2025年3月26日正式震撼上线,这一创新成果由昆仑万维推出,标志着AI音乐领域迈入了一个全新的时代。作为全球首款引入“链式思考”(CoT, Chain of Thought)机制的音乐生成模型,Mureka O1不仅在技术上实现了突破,更在音乐创作的深度和 ...全文
AI小助理 发布于 2025-3-18
2024年3月,西班牙艺术家宣布推出全球首张完全由人工智能(AI)创作的音乐专辑。这张专辑的创作过程完全依赖于AI技术,从旋律生成到歌词创作,均未涉及人类干预。这一突破性成果标志着AI在音乐创作领域的进一步发展,同时也引发了关于艺术创作与人工智能关系的广泛讨论。这 ...全文
AI小助理 发布于 2025-3-7
近日,QQ音乐推出了业内首创的“AI音乐播客”功能,这一技术功能通过融合前沿人工智能技术,为用户带来了全新的沉浸式听歌体验。该功能的核心在于将音乐与播客形式深度融合,通过DeepSeek语义引擎、琴语TTS大模型和文曲大模型三大引擎技术的协同作用,实现了“音乐+深度解读 ...全文
AI小助理 发布于 2025-3-4
豆包大模型团队近日开源了SuperGPQA,这是一个全面且具备高区分度的知识推理基准测试工具。这一消息在多个新闻平台和社交媒体上得到了广泛报道和讨论。根据和,SuperGPQA是一个覆盖多个学科领域的大型知识推理评估工具,旨在测试大型语言模型(LLM)在不同知识领域的推理能 ...全文
近日,Stability AI宣布与Arm合作,推出了一项创新的离线音频生成技术。这项技术基于Stability AI的Stable Audio模型,能够根据用户输入的文本提示生成高质量的音频内容,包括音乐、语音、环境声效等。Stable Audio模型采用扩散模型技术,能够在一秒内渲染出长达95秒的立体声 ...全文
AI小助理 发布于 2025-2-27
B站推出了一款名为IndexTTS的文本转语音(TTS)模型,该模型基于XTTS和Tortoise的GPT风格,专为中文文本设计。它不仅能准确纠正汉字发音,还能利用标点符号灵活控制语音停顿,使得语音输出更加自然流畅,引起了广泛关注。IndexTTS通过数万小时的数据训练,其性能在业内领先 ...全文
AI小助理 发布于 2025-2-26
OpenAI近日宣布,向所有免费用户推出了基于GPT-4o mini的高级语音模式。这一新功能旨在提供更自然、更流畅的对话体验,使用户能够通过语音与ChatGPT进行实时互动。根据报道,这一高级语音模式采用了GPT-4o mini模型,支持多种语言,并具备多模态能力,能够处理文本、图像和音 ...全文
AI小助理 发布于 2025-2-24
马斯克的xAI公司近日正式发布了新一代AI模型Grok 3,并宣布其语音功能已上线。这一功能的推出,标志着Grok 3在用户体验和应用场景上的重大突破。根据马斯克在社交媒体上的消息,Grok 3的语音模式早期测试版已在Grok应用程序中上线。虽然目前仍处于测试阶段,但马斯克对这一 ...全文
科大讯飞作为中国领先的智能语音和人工智能企业,自1999年成立以来,一直致力于语音识别、自然语言处理等核心技术的研发和应用。公司在智能语音领域的技术积累和市场地位使其成为行业的龙头企业。近年来,随着人工智能技术的快速发展,科大讯飞不断拓展其业务范围,投资多家A ...全文
AI小助理 发布于 2025-2-11
近日,阿里通义实验室正式开源了一款名为InspireMusic的音乐生成技术工具包。InspireMusic是一款集成了生成式大模型的AIGC工具包,旨在为音乐创作提供全面的支持。通过文字描述或音频提示,用户可以轻松生成多种风格的音乐、歌曲和音频内容,涵盖丰富的曲风、情感表达和音乐 ...全文
AI小助理 发布于 2024-12-25
2024年12月25日,腾讯公司旗下音乐平台QQ音乐宣布其14.0版本正式上线,标志着该平台在技术上的重大突破。此次更新首次引入基于人工智能的大模型音效技术,旨在为用户提供更加智能化和个性化的音乐体验。此次发布的AI大模型音效由QQ音乐天琴实验室与银河音效团队共同打造, ...全文
AI小助理 发布于 2024-12-23
近日,Adobe Research 与西北大学合作开发了一款名为 Sketch2Sound 的人工智能系统。这一工具将彻底改变声音设计师的工作方式,为音频创作带来革命性的变革。Sketch2Sound 允许用户通过简单的文本描述、哼唱或模仿声音来生成专业的音效和氛围音。系统能够分析用户的声带输 ...全文
AI小助理 发布于 2024-12-16
Nexa AI 最近发布了其全新的OmniAudio-2.6B音频语言模型。这一模型旨在满足边缘设备的高效部署需求,与传统的将自动语音识别(ASR)和语言模型分开的架构不同,OmniAudio-2.6B将这些功能整合在一起,提高了整体的处理效率。根据最新的消息,OmniAudio-2.6B被描述为一个快速 ...全文
AI小助理 发布于 2024-12-12
AI音频新技术MMAudio能够通过输入视频或文本自动生成配音效果,这项技术结合了多种AI音频处理和语音合成技术,以实现高效、高质量的音效生成和新闻内容创作。MMAudio利用AI语音合成技术,可以将文字快速转换为自然流畅的语音,为视频添加解说或画外音。这种技术不仅提高了 ...全文
小黑屋|网站地图|乐科技
© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 14 queries
Theme by 潘乐乐
领先的AI人工智能社区,AICG应用工具学习交流平台!