账号登录立即注册
印度 AI 初创企业 Avataar 依托模型蒸馏技术,打造出适配本土市场的 AI 视频生成模型,以极致性价比和文化适配能力切入赛道,走出差异化发展路线。该模型最大亮点是成本低廉,视频生成单价仅0.5 美分 / 秒,30 秒视频制作成本低至 0.15 美元,远低于 Sora、Gen-3 等主流产 ...全文
谷歌近日宣布推出全新AI模型Gemini Omni,该模型专注于视频创作领域,能够从任意输入生成高质量视频内容。类似于此前用于图像生成的Nano Banana,Gemini Omni将AI能力扩展到视频,允许用户直接在手机上为视频添加工作室级别的视觉特效,从而大幅降低专业视频制作的门槛。据公 ...全文
谷歌下一代AI视频生成模型Veo 4(或名为Gemini Omni)在官方I/O大会前夕被意外泄露。根据公开信息,该模型实现了重大技术突破,首次支持在生成视频中实现流畅的多机位切换,这意味着AI可以从不同视角讲述同一个场景,并保持物理、空间和时间的一致性。这标志着AI视频从单一的 ...全文
OpenAI 正式发布三款全新实时语音模型,分别针对对话、翻译和转录场景。其中 GPT-Realtime-2 具备高级推理能力,支持工具调用和超大上下文窗口,能边听边想边执行任务。翻译模型支持七十多种语言输入翻译成十三种语言输出,每分钟成本约零点二五元人民币,能保留说话者语调和 ...全文
Google DeepMind 宣布将自监督视频模型的参数规模扩展至 220 亿,相关代码已通过 GitHub 仓库 representations4d 开源。representations4d 托管在 google-deepmind 组织下,专注于视频表示学习研究。自监督视频模型能够在无需大量人工标注数据的情况下进行训练,此次参数规模 ...全文
AllenAI 研究团队近日正式发布了新一代视觉语言模型 Molmo2。此前初代 Molmo 模型凭借数据集、架构及训练过程的完全开源,在视觉语言模型社区产生了重要影响,为研究人员实验和创建应用提供了便利。此次发布的 Molmo2 延续了开放策略,旨在进一步推动社区发展。相关文章详细 ...全文
2026 年第一季度,AI 视频生成行业面临技术能力强但商业化难的矛盾。生数科技推出 Vidu Q3 版本,上线参考生视频功能,旨在解决商业可用性问题。Vidu Q3 针对广告、漫剧、短剧和影视剧四类场景优化,支持产品外观、角色一致性及音效同步生成。广告场景可实现多镜头切换与品牌 ...全文
OpenAI正式宣布全面关停旗下AI视频生成模型Sora,包括独立应用、网页版、开发者API接口及ChatGPT内置视频功能,实行“断崖式关停”,无任何缓冲期,标志着这款曾引爆行业的现象级视频模型正式落幕。据悉,Sora于2024年2月首次推出技术预览,2025年9月推出 ...全文
字节跳动旗下旗舰级AI视频生成模型Seedance 2.0正式启动全球上线计划,该模型于2026年2月率先在国内亮相,凭借多维度技术突破迅速成为现象级产品,此次全球上线将进一步推动AI视频创作的工业化普及,赋能全球创作者。作为字节跳动Seed团队打造的新一代模 ...全文
2026 年 3 月 16 日,阿里通义实验室正式发布并开源Fun-CineForge,为业界首个面向影视级复杂场景的多模态 AI 配音大模型,同步开放 CineDub 数据集构建方法,以 “数据 + 模型” 一体化方案破解行业配音痛点。核心亮点 首次引入时间模态,实现口型同 ...全文
豆包Seedance2.0的上线标志着国内视频生成里程碑,不亚于OpenAI在Sora2的发布,这一波热潮正好赶上春节放假时期,估计会迅速升温,大有去年DeepSeek热火朝天之势!
小红书技术团队悄然推进其在AI内容创作领域的最新布局——视频剪辑类AI产品OpenStoryline(版本号1.0.0)已进入内部测试阶段。这款产品以“AI智能体”为核心定位,主打“对话式剪辑”模式,用户无需掌握复杂的时间轴操作,只需通过自然语言指令,如“剪一个 ...全文
字节跳动旗下即梦平台正式推出多模态 AI 视频生成模型 Seedance 2.0,引发行业广泛关注。该模型不仅支持文本或图片生成高质量视频,更实现了对运镜、分镜、光影、音画同步等影视核心要素的精细控制,被业内称为“视频领域的 GPT-3.5 时刻”。Seedance 2.0 ...全文
埃隆·马斯克通过社交平台正式宣布,其旗下人工智能公司 xAI 推出的文本转视频生成工具 Grok Imagine 1.0 全面上线。新版本支持生成10秒、720p高清视频,并配备优化后的音频系统,可同步生成情感语音与背景音乐。据 xAI 透露,该工具在过去30天内已产出超 ...全文
中国大模型公司 MiniMax(稀宇科技)正式发布新一代 AI 音乐生成模型 MiniMax Music 2.5。该版本在“段落级强控制”与“物理级高保真”两大核心技术上实现重大突破,显著提升 AI 音乐的专业性与听感表现。Music 2.5 首次支持 14 种音乐结构标签(如前奏、 ...全文
手机版|小黑屋|网站地图|乐科技
© 2021-2026 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 15 queries
Theme by 潘乐乐
领先的AI人工智能社区,AI智能体应用工具学习交流平台!