账号登录立即注册
今日: 0|主题: 181|排名: 20
2025年11月12日,Character AI 与耶鲁大学研究团队共同推出全新多模态生成模型 Ovi(全称:Twin Backbone Cross-Modal Fusion for Audio-Video Generation),首次实现音频与视频在统一架构下的同步生成。该模型以开源形式发布,打破当前主流音画生成系统闭 ...全文
人工智能生成的音乐作品首次同时登上 Spotify 全球热门榜单与 Billboard 权威排行榜冠军位置,标志着 AI 在主流音乐领域的突破性进展。由虚拟艺术家 Breaking Rust 创作的乡村单曲《Walk My Walk》凭借高度拟人化的旋律与情感表达,在 Billboard 乡村数字 ...全文
近日,可灵AI正式推出其最新一代视频生成大模型——可灵2.5 Turbo。该版本在文本理解、动态表现、风格一致性与美学质量等多个维度实现显著提升,并同步上线备受期待的“首尾帧控制”功能,进一步增强AI视频创作的精准性与可控性。可灵2.5 Turbo能够更准确 ...全文
近日,人工智能语音技术公司ElevenLabs宣布与多位好莱坞知名演员达成深度合作,正式推出基于授权的AI合成语音服务。奥斯卡获奖演员马修·麦康纳与迈克尔·凯恩已率先加入该计划,将其标志性声线授权用于合法商业用途。作为ElevenLabs的早期投资者,麦康纳 ...全文
Meta 近日正式推出开源自动语音识别(ASR)系统 Omnilingual ASR,可高精度识别超过 1600 种人类语言,其中包括 500 种此前从未被AI覆盖的小众或濒危语言,大幅缩小全球“语言鸿沟”。该系统基于自监督学习架构,结合 wav2vec 2.0 与 Transformer 解码技 ...全文
知名人工智能学者、斯坦福大学教授李飞飞近日发表万字长文,提出一个颠覆性观点:AI 的未来不在于继续堆叠参数规模,而在于掌握“空间智能”(Spatial Intelligence)——即对物理世界的感知、推理与交互能力。她指出,当前以大型语言模型(LLM)为代表的 ...全文
Meta 今日正式推出其新一代自动语音识别(ASR)系统 Omnilingual ASR,可高精度识别和转录 超过 100 种语言及方言,包括大量低资源语言,如卢旺达语、旁遮普语和伊博语等。该系统标志着 Meta 在构建真正全球化语音理解能力方面迈出关键一步。Omnilingual ...全文
字节跳动正式推出全新视频生成框架 InfinityStar,显著提升高质量视频的生成效率。该框架可在仅 58 秒内生成一段 5 秒、720p 分辨率的高清视频,同时支持图像生成、文本到视频、视频续写等多种视觉生成任务。InfinityStar 的核心技术突破在于其创新的 时 ...全文
2025年11月9日,埃隆·马斯克在社交平台X上转发了一段由AI生成的视频作品——该视频以惊人细节复现了经典科幻电影《银翼杀手》中的未来洛杉矶街景:霓虹闪烁的雨夜、悬浮车辆穿梭、全息广告与仿生人身影交织,画面风格高度还原原作美学。据创作者透露,该 ...全文
人工智能公司阶跃星辰正式开源其基于大语言模型(LLM)架构的音频编辑模型 Step-Audio-EditX。该模型参数量达30亿,是全球首个支持通过自然语言指令对语音进行精细化编辑与生成的开源音频大模型。Step-Audio-EditX 可实现情感、语调、方言、语速等语音属 ...全文
2025年11月10日,埃隆·马斯克旗下人工智能公司 xAI 宣布,其 AI 视频生成工具 Grok Imagine 正式升级,全面支持纯文本生成高质量短视频。用户仅需输入一段文字描述,即可在约17秒内获得一段6至15秒、包含动态镜头与AI生成音效的专业级视频,无需上传图片或 ...全文
OpenAI 今日宣布其热门 AI 视频生成应用 Sora 正式上线 Android 平台,已在 Google Play 商店面向美国、加拿大、日本、韩国、泰国和越南等国家开放下载。此举标志着 Sora 继9月底登陆 iOS 后,完成移动端全平台布局。Android 版 Sora 保留 iOS 版全部核心 ...全文
据Billboard最新榜单显示,AI驱动的虚拟音乐人 Xania Monet 凭借单曲《How Was I Supposed to Know?》成功跻身 成人R&B电台榜第30位,成为历史上首位进入该权威榜单的完全由人工智能参与创作与演唱的艺术家。该歌曲由美国密西西比州诗人Telisha Jones创作 ...全文
网易云音乐今日正式上线全新音效功能“AI调音大师”,基于生成式AI与智能音频分析技术,为用户提供实时、个性化的音效优化服务。“AI调音大师”可根据用户当前播放的歌曲类型、设备特性及个人听感偏好,自动调整均衡器参数、空间声场与动态范围,实现“千 ...全文
人工智能公司 MiniMax 正式推出其新一代AI音乐生成模型——Music 2.0。该模型支持从文本、旋律片段或情绪描述一键生成高质量、多风格、结构完整的原创音乐作品,时长可达5分钟,涵盖人声演唱、乐器编曲与母带处理全流程。Music 2.0 基于MiniMax自研的多模 ...全文
小黑屋|网站地图|乐科技
© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 14 queries
Theme by 潘乐乐
领先的AI人工智能社区,AI智能体应用工具学习交流平台!