账号登录立即注册
今日: 0|主题: 198|排名: 18
2025年12月12日,国产AI Agent新锐产品Medeo正式推出其升级版视频智能体(Video Agent),以“全自动视频助理”为核心定位,再次刷新内容创作效率。新版Medeo支持用户仅输入一段文字或文章链接,即可自动生成包含配音、字幕、剪辑节奏、背景音乐及封面设 ...全文
2025年12月12日,OPPO ColorOS设计总监陈希宣布,ColorOS将于本月系统更新中上线全新AI功能——“AI妙听”。该功能可将任意文章一键转化为高质量的双人播客,不仅实现文本到语音的转换,更通过AI对内容进行语义重构,以自然对话形式呈现,并搭配背景音乐, ...全文
谷歌宣布 Gemini 2.5 系列文本转语音(TTS)模型——Gemini 2.5 Flash 与 Gemini 2.5 Pro 的 TTS 预览版完成重大升级并正式上线。此次更新显著提升语音合成的自然度、表现力与多语言支持能力,为 AI 应用开发者提供更强大、高效的语音交互工具。Gemini TT ...全文
苹果公司正式发布其自主研发的视频生成模型 STARFlow-V,该模型摒弃当前主流的扩散架构,转而采用“归一化流”(Normalizing Flow)技术,在保证视觉质量的同时显著提升生成效率与长视频稳定性。STARFlow-V 能在单次前向推理中完成视频生成,无需多步去噪 ...全文
阿里巴巴通义实验室正式推出全新语音合成模型 Qwen3-TTS,主打“零样本、多角色、跨语言”能力,显著优于主流商用引擎。该模型内置 49种高品质音色,覆盖客服、教育、直播、旁白等多元场景,并支持 10种语言及9种中国方言,包括粤语、四川话、东北话等。 ...全文
快手旗下人工智能创作平台可灵 AI 正式推出全新“主体库”功能,显著提升视频与图片生成中角色的一致性表现。依托 O1 多模态模型,“主体库”支持用户上传单张或多角度参考图,AI 即可自动补全3D视角并生成智能描述,实现对角色、场景或道具的长期记忆与 ...全文
微软正式推出其全新语音生成模型 VibeVoice 0.5B。该模型参数规模为5亿(0.5B),主打低延迟、高自然度与多语言支持,专为移动端和边缘设备优化,适用于实时语音助手、游戏配音、无障碍交互等场景。VibeVoice 0.5B 基于微软自研的神经语音合成架构,仅需 ...全文
快手旗下AI创意平台KlingAI宣布推出 KlingAI Avatar 2.0,全面升级其数字人生成与交互能力。新版本在表情自然度、语音同步精度、多语言支持及个性化定制等方面实现重大突破,为内容创作者、企业营销和虚拟社交提供高效、逼真的AI数字人解决方案。Avatar 2 ...全文
快手旗下可灵AI正式宣布其最新版本——可灵2.6模型全量上线。该模型为业内首个实现“音画同出”的多模态生成系统,可在单次操作中同步生成画面、自然语音、匹配音效与环境氛围,显著提升内容创作效率与沉浸感。可灵2.6提供两种核心创作路径: 文生音 ...全文
AI 视频创作平台 Runway 正式推出其最新一代视频生成模型 Gen-4.5,在动态真实感、物理交互与复杂场景控制方面树立行业新标杆。该模型支持长达 18 秒的 4K 视频生成,首次引入“物理感知扩散架构”(Physics-Aware Diffusion),可精准模拟流体、布料、光影 ...全文
AI 视频生成先锋企业爱诗科技(iShi Tech)正式推出其旗舰产品 PixVerse V5.5 版本。新版本在动态连贯性、镜头语言控制与多角色一致性三大核心维度实现突破,首次支持用户通过自然语言指令生成具备专业运镜、光影调度和叙事节奏的“电影感”短视频。PixVe ...全文
2025年12月2日,阿里巴巴旗下千问APP正式接入通义万相系列最新模型——Wan 2.5,同步推出全新图片生成与编辑模型 Qwen-Image。用户即日起可免费、无限次使用多项前沿AI创作功能,开启移动端音画同步智能创作新体验。Wan 2.5 是目前业界少数支持多语种音画 ...全文
字节跳动今日正式推出全新 AI 视频编辑工具 Vidi2,旨在为内容创作者、短视频团队及普通用户提供“零门槛、高效率、电影感”的一站式视频创作体验。Vidi2 基于字节自研的多模态大模型 Coze-Vision 2.0,支持语音指令驱动剪辑、AI 自动生成分镜脚本、智能 ...全文
人工智能公司 StepFun AI 今日正式发布其首款音频大语言模型 Step-Audio-R1。该模型深度融合语音理解、生成与语义推理能力,支持高保真语音合成、跨语言口音迁移、情感化对话及复杂音频指令执行,标志着 StepFun 在多模态 AI 领域迈出关键一步。Step-Audi ...全文
大模型公司智谱AI正式推出其视频生成模型 GLM-Vision Video 清影2.0。该版本支持用户仅凭一句自然语言描述,即可在30秒内生成1080P高清、时长6秒的连贯视频,显著提升画面质量、动作流畅度与语义对齐精度。清影2.0基于智谱自研的多模态大模型 GLM-V 4 架 ...全文
小黑屋|网站地图|乐科技
© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 15 queries
Theme by 潘乐乐
领先的AI人工智能社区,AI智能体应用工具学习交流平台!