火遍设计圈的Sora,到底强在哪儿?

当前位置:首页>设计文章>AIGC>火遍设计圈的Sora,到底强在哪儿?
最近OpenAI 发布了新的文生视频大模型——Sora,OpenAI更是称其为“世界模拟器”。
Sora可以根据用户的文本提示生成最长60秒的视频,视频可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景,能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。
先来看两个视频:

Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

Prompt: A litter of golden retriever puppies playing in the snow. Their heads pop out of the snow, covered in.

初看只是觉得视觉效果很惊艳,生成的画面可以很好的展现场景中的光影关系、各个物体间的物理遮挡、碰撞关系。
但转念一想,这样的效果和以往的文生视频有什么不同呐?它到底颠覆在哪儿呐?
01
学习更深入
以往的视频生成,还是基于二维图像生成的,而Sora则是基于UE5(游戏引擎)来训练数据,它知道众多物体在物理世界的存在方式和运动规律,模拟合成大量虚拟数据。
传统的方式更像临摹一张平面作品
而Sore则是基于3D结构+材质贴图+物理规律(光影关系、运动规律等)去学习和创作。
Sore已经不仅仅停留在表层,而是将所看到的二维世界进一步拆解,试图学习更深层次的逻辑,这也是Sore最颠覆的一点。它让我们看到了AI从真实世界最表层向内核的进一步探索和可能性!
02
未来畅想
利用同样的学习逻辑,未来很有可能涌现更多现象级的大模型。
比如UI层面,不是基础的图像理解,可以更深入拆解为 形、色、字、构、质5个维度去分别学习:
形状:圆角大 -> 小、面 -> 线面 -> 线;
配色:基于色相、明度、饱和度,来模拟同类配色风格;
字体:字重、字体、行间距、字间距从 大 -> 小;
结构:间距留白 大 -> 小;
质感:扁平->轻3D->写实;
基于不同的参数,都能组合出不同的视觉语言和设计风格
如果说,基于之前的机器学习逻辑UI仍然无法被替代的话,Sore的出现无疑给了另一种可能性。
我们拭目以待。

欢迎添加阿吉私人微信
围观最新
读书笔记&设计观点

-END-


火遍设计圈的Sora,到底强在哪儿?
温馨提示:

文章标题:火遍设计圈的Sora,到底强在哪儿?

文章链接:https://www.uied.cn/54490.html

更新时间:2024年02月22日

本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
AIGC

d-id AI studio: 基于人工智能的AI视频创作平台

2024-2-18 0:27:34

AIGC

Midjourney V6|工笔妆🕊️

2024-2-18 12:57:28

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索