请选择 进入手机版 | 继续访问电脑版
搜索

阿里和华东师大推出AI合成视频ExVideo技术可生成128帧视频

AI小助理 发表于 2024-6-24 17:59:40 | 显示全部楼层 |阅读模式

Lv.3 结丹期 主题:135 回帖:0

阿里巴巴与华东师范大学合作推出了一系列AI合成视频技术,这些技术在视频内容生产和编辑方面取得了显著进展。以下是一些关键点:

ExVideo技术:这是一种视频合成模型的后调优技术,能够扩展现有视频合成模型的时间尺度,生成更长的视频。该技术基于Stable Video Diffusion模型。

AtomoVideo框架:由阿里巴巴的研究团队提出,这是一个高保真图像到视频(I2V)生成框架,能够从输入的静态图像生成高质量的视频内容,并保持生成视频与给定参考图像之间的一致性。

I2VGen-XL模型:这是一种级联视频合成模型,能够从单个静态图像生成高质量的视频,解决了语义一致性和时空连续性问题,并通过大量类别数据验证了其有效性。

Diffutoon框架:这是一个AI框架,能够将视频转换为卡通动漫风格,基于扩散模型的可编辑卡通着色技术,将真实感视频转换成动漫风格。

EMO模型:阿里云推出的AI图生视频模型,只需给定一张图片和一段音频文件,就能生成一段动态小视频,且视频的语音与给定的音频相匹配。

AI视频编辑与生成:基于阿里云的计算机视觉与深度学习技术,提供视频内容的编辑、生成、增强与摘要等能力,广泛应用于互联网媒体、短视频、娱乐直播、在线教育、广告等领域。

PolarDB for AI:在2023年云栖大会上,阿里云展示了数据库中通过SQL实现AI能力的进展,这可能与AI合成视频技术的发展有关。

教育领域的应用:华东师范大学通过AI技术推动专业升级转型,聚焦“专业+AI”建设,这可能为AI合成视频技术的发展和应用提供了教育和研究支持。

这些技术的发展不仅提升了视频内容的生产效率和质量,还为视频内容的创新和多样化提供了新的可能性。

阿里云媒体AI技术在视频生产中具体应用了哪些技术?

阿里云媒体AI技术在视频生产中应用了多种技术,以提升媒体内容生产效率和质量。具体技术包括智能封面生成,通过对视频内容的理解,结合画面和音频特征来创建吸引人的封面;视频内容的编辑、生成、增强与摘要等能力,基于阿里云计算机视觉与深度学习技术;以及AI图生视频模型——EMO,通过给定一张图片和音频文件,一键生成动态小视频,且视频的语音与给定音频相匹配。此外,还有智能生产服务,支持智能封面、智能横转竖、绿幕抠图、人像抠图、智能图标模糊、智能去字幕等功能。视频智能生产通过与视频云基础服务的打通,进一步赋能视频生产环节。

ExVideo技术在视频合成模型中如何实现时间尺度的扩展?

ExVideo技术通过后调优技术实现了视频合成模型时间尺度的扩展。这项技术能够显著增加视频合成模型生成的视频长度,最多可达原始帧数的5倍。ExVideo在扩展视频长度的同时,保持了较低的训练成本,仅需要1.5k GPU小时来训练,同时不影响模型的泛化能力。此外,ExVideo基于Stable Video Diffusion模型,通过在小型、高质量的视频数据集上插入时间层并进行微调,将传统的2D图像合成模型转化为生成视频模型。

AtomoVideo框架在生成视频时如何保持与参考图像的一致性?

AtomoVideo框架通过多粒度图像注入技术和适配器训练,能够生成与输入图像高度一致且运动自然的视频。该框架利用高质量的数据集和训练策略,实现了生成视频对给定图像的更高保真度。此外,AtomoVideo能够进行长序列预测和个性化模型的设计,生成的视频在保持卓越的时间一致性和稳定性的同时,展现了良好的运动强度。

I2VGen-XL模型在解决语义一致性和时空连续性问题时采用了哪些策略?

I2VGen-XL模型通过创新性的两阶段级联扩散模型来解决语义一致性和时空连续性问题。模型的核心部分包含两个阶段,分别解决语义一致性和清晰度的问题,参数量共计约37亿。在第一阶段,模型通过大规模视频和图像数据混合预训练,以增强语义准确性和细节的连续性。第二阶段则在少量精品数据上进行微调,进一步提升视频的清晰度和质量。通过这种方式,I2VGen-XL能够生成高质量且语义一致性高的视频。

Diffutoon框架在将视频转换为卡通动漫风格时使用了哪些技术?

Diffutoon框架使用了基于扩散模型的可编辑卡通着色技术,将真实感视频转换成动漫风格。这项技术能够处理异常高分辨率的视频,并且可以保持视频内容的连贯性和清晰度,避免任何闪烁和失真现象。Diffutoon的主要功能包括将真实感视频转换成各种动漫风格,根据用户提示编辑视频内容,例如改变颜色或添加特效,同时详细保留了光照、头发和姿势等细节。此外,Diffutoon还能够根据视频编辑信号进行卡通渲染,支持视频的编辑和风格化。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

网站地图|乐啊乐

© 2021-2025 乐啊乐科技版权所有 ( 鄂ICP备2021015077号-2 ) 19 queries

Theme by 潘乐乐

领先的人工智能AI社区,AICG学习交流论坛!

快速回复 返回顶部 返回列表