Open-Sora悄悄升级支持16秒视频生成和720p分辨率-带水拖泥网

当前位置：首页 > 电商 > Open-Sora悄悄升级支持16秒视频生成和720p分辨率正文

Open-Sora悄悄升级支持16秒视频生成和720p分辨率

时间：2024-07-02 04:06:03 来源：带水拖泥网作者：自媒体阅读：886次

Open-Sora悄悄升级支持16秒视频生成和720p分辨率

CSS站长资源（ChinaZ.com）4月25日消息:Open-Sora 在开源社区悄悄更新了，悄悄现在，升级该项目不仅支持长达16秒的支持单镜头视频生成，而且视频分辨率最高可达720p，秒视能够处理各种宽高比的频生文本到图像、文本到视频、成和图像到视频、辨率视频到视频以及无限长视频的悄悄生成需求。

技术报告与模型架构:

Open-Sora技术报告已在GitHub上发布，升级详细介绍了新功能和模型架构。支持

作者团队对STDiT架构进行了关键性改进，秒视提高了模型的频生训练稳定性和整体性能。

引入了旋转位置编码（RoPE embedding）和QK归一化技术，成和以增强训练稳定性。辨率

ST-DiT-2架构能够自动缩放位置编码，悄悄处理不同大小尺寸的输入。

多阶段训练方法:

Open-Sora采用了多阶段训练方法，通过分步骤引入数据，高效实现高质量视频生成。

初始阶段视频采用144p分辨率，混训图片和更高分辨率视频。

第二阶段提升至240p和480p分辨率，第三阶段进一步增强至480p和720p。

统一的图生视频/视频生视频框架:

基于Transformer，DiT架构可支持图像到图像及视频到视频任务。

提出掩码策略来支持图像和视频的条件化处理。