会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 大佬拆解Sora工作原理 看完你就知道Sora为什么这么牛了!

大佬拆解Sora工作原理 看完你就知道Sora为什么这么牛了

时间:2024-07-02 03:31:35 来源:带水拖泥网 作者:业界 阅读:596次

大佬拆解Sora工作原理 看完你就知道Sora为什么这么牛了

CSS站长资源(ChinaZ.com)2月21日 消息:Sora是大佬一款独特的视频生成工具,其工作原理深入浅出,拆解值得我们深入了解。工作something new/old创始人brett goldstein在X上给大家拆解了Sora工作原理,原理通俗易懂。看完

Sora的知道工作原理结合了扩散模型和Transformer架构。扩散模型从噪声开始,大佬逐渐精细化到所需的拆解视频。而Transformer架构则负责处理连续的工作视频帧,确保视频中的原理动作流畅自然。

Sora的看完独特之处在于其处理视频生成的方法。它不是知道直接将文本转换为视频帧,而是大佬依赖于所谓的“空间时间补丁”。这种方法不直接将文本转换为视频帧,拆解而是工作处理空间(发生的事情)和时间(何时发生)的快照。这可以看作是微观视频拼图的每一小块。

时空立方体:

通过这种方式,Sora将视频视为一个包含空间和时间维度的巨大立方体,然后再将其切割成更小的立方体,每个立方体代表空间和时间的片段。

剖析描述并确定了核心要素:

• 物体(盛开的花朵、阳光普照的窗台)

• 行动(随着时间的推移而增长)

• 位置(郊区环境)

• 甚至艺术风格(定格动画美学)

为了能够将这些补丁有意义地组合成一个连贯的视频,Sora利用了其内部的知识图谱。这些知识图谱包含了关于物理世界、对象如何相互作用,甚至包括不同艺术风格的信息。借助这些知识,Sora能够理解例如一朵花如何逐渐开放、如何与阳光互动以及如何保持停动画风格等复杂过程。

在视频生成的下一阶段,扩散模型开始对每个嘈杂、抽象的补丁进行处理,逐渐精细化,直至最终呈现出清晰的图像。而Transformer架构则负责分析时间跨度上补丁之间的关系,确保视频中的动作流畅自然,停动画风格在整个视频序列中保持一致。

尽管Sora能够执行各种与视频相关的任务,并展现出惊人的视频生成能力,但仍有一些挑战需要克服。例如,它在模拟一些基础物理互动的精确性方面还有待提高,有时会产生不自然的效果,如人物的手势看起来不够真实。尽管如此,Sora在视频生成技术方面展示了巨大的潜力,为未来的人工智能应用开辟了新的可能性。

拆解原文地址:https://twitter.com/thatguybg/status/1759935959792312461

猜你想看:

Sora怎么用?sora提示词大全:超100个Sora专属提示词

sora怎么用?sora从哪里下载?sora提示词教程 附30个sora提示词案例

Sora怎么用?附详细Prompts及使用入口地址

(责任编辑:知识)

相关内容
  • 活了这么久 次见高铁10码速度缓慢行驶
  • 法国AI初创公司 Mistral AI 估值 60 亿美元
  • 这项链戴上根本不敢咳嗽:女子晒出“特别”项链
  • 张勇现身哪吒L首批车主交付现场 鞠躬90度为车主开车门
  • 两乘客买到“同日同座”高铁票 12306官方解释原因
  • 影刀AI有哪些功能免费吗?影刀AI怎么使用方法详细教程指南
  • 支付宝可以考“四级”了 还有1500元现金补贴
  • 魅族21 Note手机官宣:全新FlymeAIOS 5月16日见
推荐内容
  • 智心云言体验入口 AI智能对话与绘画工具在线使用地址
  • 达美乐回应母亲节送围裙:是为了表达对妈妈的感激
  • 1个月涨粉208万!一张嘴骂遍了国外文旅,却在抖音和视频号上爆火?
  • OpenAI或于5月13日推出AI搜索引擎,挑战谷歌主导地位
  • Google Bard 全球更新:支持40种语言、添加图像生成功能
  • 人死后聊天记录会被怎样处理 专家:所有权归腾讯公司所有