-
OpenAI炸裂的Sora背后:奥特曼清单法
本文来自微信公众号: 孤独大脑(ID:lonelybrain) ,作者:老喻,题图来自:视觉中国 一 那些正在改变世界的事情,正在加速发生。 OpenAI刚刚发布了 Sora,一种文字生成视频的技术,效果相当震撼。请看下面的视频: 如此逼真的视频,仅需如下一段提示词: “一位时尚的女士在充满温暖发光的霓虹灯和动画城市标志的东京街道上行走。她穿着黑色皮夹克,一条长红裙和黑色靴子,背着黑色手提包。她戴着太阳镜和红色口红。她走路自信而随意。街道潮湿而具有反射性,营造出五光十色灯光的镜面效果。许多行人在四处走动。” 这款名为Sora的新视频生成模型,能够根据文本指令创建现实和富有想象力的场景。用户可以基于编写的提示词,创建长达一分钟的栩栩如生的视频。 Sora能创建包含多个角色、特定动作、主题和背景细节的复杂场景。 该模型理解物体在物理世界中的存在,能准确解释道具,并生成表情丰富的角色。它还能基于静态图像生成视频,填充或扩展现有视频的帧。 在我看来,AI对人类世界的改变有两个方向: 1. 改变物理世界:协助科学家在人类生物、能源、医疗、新材料等方面实现科技突破; 2. 构建虚拟世界:大量生成文本、图像和视频内容,并以数字机器人形态服务于虚拟世界。 同样,我继续表达“教育是AI的最佳应用场景”的观点: Sora等视频生成技术,将令优质教育资源的成本大幅降低; 仿真的沉浸式教学空间可以被大规模提供,令学生在身临其境的场景中展开项目式学习; 一对一的“硅基生物”老师已经完全具备了“碳基生物”老师的鲜活和“温度”; …… 二 让我们回来,看看改变世界的技术背后,那些开创者们的具体思考和行为。 这两年,愈发感受到硅谷创业者们不分老少,对AI等技术充满了信仰般的痴迷。 另一方面,则是工程师式的务实和坚韧。 只有如此,技术的梦想才能落地。 OpenAI的创始人奥特曼,几年前曾经写过一篇文章《如何提高工作效率》,颇有启发。 其中,奥特曼的清单法,也许对每个努力工作的人,都有可借鉴之处。 分享如下: 1. 生产率 我认为我的工作效率至少比平均水平高一些,人们有时会向我询问提高工作效率的秘诀。所以我决定把它们全部写在一个地方。复合增长作为一个财务概念被讨论,但它也适用于职业,而且它很神奇。在 50 年的时间里,生产率的小幅提高是非常值得的。因此,有必要弄清楚如何优化生产力。 如果你每天比别人多做 10%,进步 1%,复合 (增长) 的差异是巨大的。 2. 你在做什么 如果它朝着毫无价值的方向前进,那么你移动多快都没有关系。选择正确的工作是生产力最重要的因素,通常几乎被忽略。所以多想想吧!独立思考很难,但你可以通过练习变得更好。 我认识的最令人印象深刻的人对世界有着强烈的信念,这在普通人群中是很少见的。 如果你发现自己总是同意你最后一次交谈的人,那就不好了。 有时你当然会错,但要培养坚持自己信念的信心。当您在大多数人看不到的重要事情上是正确的时,它会让您变得勇敢。 我确保在我的日程安排中留出足够的时间来考虑要做什么。对我来说,最好的方法是读书、和有趣的人一起出去玩,以及花时间在大自然中。 我了解到,在我不关心或不喜欢的事情上,我的工作效率不会很高。所以我只是尽量不让自己处于必须做这些事情的境地(通过委派、避免或其他方式)。你不喜欢的东西会严重拖累士气和动力。 顺便说一句,这里有一个关于委派的重要教训:记住其他人在做自己喜欢的事情时也是最有效率的,并且做你希望别人为你做的事情——试着找出谁喜欢( 并且擅长)做什么,并以那种方式授权。 如果你发现自己在很长一段时间内都不喜欢自己所做的事情,请认真考虑换一份工作。短期的倦怠会发生,但如果休息一段时间后还没有解决,也许是时候做一些你更感兴趣的事情了。 我很幸运能找到我非常喜欢的工作,我愿意免费做,这让我很容易真正有效率。 重要的是要知道你可以学到任何你想学的东西,而且你可以很快变得更好。最初几次,这感觉像是一个不太可能发生的奇迹,但最终你学会相信自己可以做到。 出色的工作通常需要某种同事。 试着和聪明、多产、快乐、积极的人在一起,他们不会贬低你的抱负。 我喜欢和那些推动我并激励我变得更好的人在一起。 在你力所能及的范围内,避开相反类型的人——让他们占用你的思维周期的代价是可怕的。 你必须选择正确的问题并完成工作。没有多少捷径。如果你要做一些非常重要的事情,你很可能会既聪明又努力地工作。 最大的奖项竞争激烈。并非在每个领域都是如此(有些伟大的数学家从来没有每周花那么多小时工作),但在大多数领域都是如此。 3. 优先次序 我的系统有三个关键支柱: a. “确保完成重要的事情”; b. “不要把时间浪费在愚蠢的事情上”; c. “列很多清单”。 我强烈推荐使用列表。我列出了我每年、每月和每天想要完成的事情。列表非常有针对性,它们帮助我处理多项任务,因为我不必在脑海中保留那么多。 如果我没有心情完成某项特定任务,我总能找到其他让我兴奋的事情。 我更喜欢写在纸上的清单。添加和删除任务很容易。我可以在会议期间访问它们而不会感到粗鲁。我经常重新抄写列表,这迫使我考虑列表中的所有内容,并让我有机会添加和删除项目。 我不会为分类或尝试调整任务大小或类似的事情而烦恼(我所做的最多就是在真正重要的项目旁边放一个星号)。 我尝试以产生动力的方式确定优先顺序。我完成的越多,我的感觉就越好,然后我就完成得越多。我喜欢在每一天开始和结束时做一些我能真正取得进步的事情。 我坚持不懈地完成我最重要的项目——我发现如果我真的想要某事发生并且我努力推动,它通常会发生。 我尽量无情地拒绝某些东西,并以尽可能快的方式做非关键的事情。我可能太过分了——例如,我几乎可以肯定我在回复电子邮件时简洁到粗鲁的地步。 我通常尽量避免参加会议,因为我发现时间成本很高——我在办公室的时间得到了最大的价值。然而,在您的日程表中留出足够的空间以允许偶遇和接触新的人和想法是至关重要的。 拥有一个开放的网络是有价值的。 虽然我参加的随机会议中可能有 90% 是浪费时间,但另外 10% 确实弥补了它。 我发现大多数会议最好安排在 15-20 分钟或 2 小时内。默认的 1 小时通常是错误的,会导致大量时间浪费。 我每天有不同的时间尝试用于不同类型的工作。早上的前几个小时绝对是我一天中最有效率的时间,所以那时我不会让任何人安排任何事情。 我尽量在下午开会。每当我觉得自己的注意力开始减弱时,我就会休息一下或转换任务。 我认为大多数人都没有足够重视他们的时间——令我惊讶的是,我认识的许多人每小时赚 100 美元,但他们会花几个小时做他们不想做的事情以节省 20 美元。 另外,不要陷入关于生产力的陷阱——为了自身的利益而追求生产力是没有帮助的。许多人花太多时间思考如何完美优化他们的系统,而没有足够多地询问他们是否在处理正确的问题。 无论您使用什么系统,或者如果您正在做错误的事情,您是否每秒都在挤出时间,这并不重要。正确的目标是最佳地分配你的一年,而不是你的一天。 4. 物理因素 很可能对我而言最佳的对您而言并非最佳。您必须通过实验找出最适合您身体的方法。这绝对值得一做——它对生活的方方面面都有帮助,你会感觉更好、更快乐。 在过去的几年里,我可能每周都会花一点时间来找到最适合我的东西,但我的感觉是,如果我在以下所有方面都做得很好,我的工作效率至少比不这样做的情况高 1.5 倍。 对我来说,睡眠似乎是影响生产力的最重要的物理因素。某种睡眠追踪器可以帮助您了解如何睡得最好。 我喜欢寒冷、黑暗、安静的房间和一张很棒的床垫(我多年来一直拒绝花一大笔钱买一张很棒的床垫,这是愚蠢的——它对我的睡眠质量产生了巨大的影响。我喜欢这个)。 旅行时,我使用眼罩和耳塞。 这可能会引起争议,但每当我无法入睡时,我都会服用低剂量的安眠药(如正常剂量的三分之一)或极低剂量的XX。总的来说,我睡不好,旅行时睡得特别不好。它可能需要权衡取舍,但睡眠不好也是如此。如果你已经睡得很好,我不会推荐这个。 锻炼可能是第二重要的身体因素。 我尝试了几个月的许多不同的锻炼计划,似乎最好的是每周举重 3 次,持续一小时,偶尔进行高强度间歇训练。除了提高工作效率外,这也是让我整体感觉最好的锻炼计划。 第三个领域是营养。 我很少吃早餐,所以大多数日子我禁食大约 15 小时(除了我醒来时喝一杯浓缩咖啡)。我知道这与大多数建议相反,我怀疑这对大多数人来说都不是最佳选择,但它对我来说绝对有效。 吃太多糖是让我感觉最糟糕的事情,也是我最努力避免的事情。我也尽量避免吃会加重消化或加剧炎症的食物(例如,非常辛辣的食物)。说到甜食,我没有太多的意志力,所以我大多只是尽量把垃圾食品拒之门外。…
-
Sora可生成游戏?!
点击上方蓝字 CG世界 关注我们 “ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ” 中国很有影响力影视特效CG动画领域自媒体 提问:最近业内最热话题是什么? 相信小伙伴们都可以抢答成功,那必须是OpenAI最新推出的黑科技:首个AI生成视频模型Sora。 你永远可以相信OpenAI的实力,不出手则已,一出手惊人。作为行业的领头羊,前有 DALL-E、ChatGPT等在各领域收获巨大成功的优秀工具,现在又来了个能通过文本生成逼真视频而震惊全网的Sora,这也预示着人工智能领域的又一重大进步。 Sora只需要几行提示,仅仅根据文本描述就能生成令人惊叹的视频。就在我们感叹这款新王炸真的很强的时候,OpenAI表示:我知道你们很震撼,但你们先别震撼,因为它可能预想中还要厉害。 根据OpenAI最新发表的技术论文显示,Sora的能力似乎比OpenAI最初认为的还要强大和不可思议。 这篇论文由OpenAI的多个研究人员共同撰写,揭示了Sora架构的关键方面:如 可以生成任意分辨率和宽高比的视频(高达1080p);能够执行各种图像和视频编辑任务,从创建循环视频到向前或向后扩展视频时间到更改现有视频中的背景。 要说Sora最强悍的还要数“模拟数字世界”的能力,其中的一个例子就是游戏。 按照OpenAI的合著者所说,在一项实验中,OpenAI向Sora提供了包含“Minecraft”一词的提示,并让它渲染出令人信服的类似《Minecraft》的HUD和游戏,以及游戏动态,包括物理运动,同时控制玩家角色。 有社交媒体账户展示了由AI生成的《我的世界》视频。 这段由Sora生成的视频,以玩家在平原生物群系中慢动作行走开始。通过观察整体的纹理外观,可以推测出Sora模型使用了具有不同天空纹理和灯光引擎的资源包以及着色器。 同时,显示生命值、饱食度和物品的快捷栏看起来也非常地准确。当玩家行走时,可以看见纹理完全不同的一只鸡和一只猪,也侧面证实了Sora使用资源包来生成游戏视频。 仅仅是在提示文字中加入“Minecraft”关键词,Sora就可以零样本展示出它自主控制游戏角色进行基本操作,同时渲染出游戏世界和游戏中动态变化的能力。 OpenAI认为,Sora的这种能够完整模拟游戏世界的能力,表明视频生成AI的发展正在朝着能够高度仿真物理和数字世界, 及其中的动物和人等对象 的方向迈进。 而之所以说Sora模型有潜力颠覆视频游戏世界,原因在于它与其他的AI视频生成器有着根本的不同。 Nvidia高级研究员Jim Fan博士就曾指出,比起图像生成器,Sora更像是一个“基于数字训练的物理引擎”,可以模拟许多真实或虚拟的世界。不仅能生成单个照片或视频,还能确定环境中每个对象的物理属性, 并根据这些计算渲染照片、视频或交互式3D世界(视情况而定)。 Sora 能够执行成千上万次计算来预测 物体之间的相互作用关系,从而生成游戏物理规则,这就使得它非常适合游戏世界的模拟。 当然, S ora目前在游戏模拟方面也存在一定的局限性。它还无法精确模拟像玻璃破碎这样的物理效果,也会在生成游戏交互时出现一些不合理的细节。 在生成的《Minecraft》游戏视频中,也存在类似的问题。当玩家靠近猪并触碰它时,它开始向后跑,但脸却是朝向玩家的…视频中 猪继续在地面上滑行,最终消失在远处的小屋里;不久之后,玩家走近湖旁的小屋,这时可以看到 湖里有几只“奇怪”的动物,从脸上看像牛,但又不太符合身体力学。 不少网友表示,虽然视频总体看起来像《Minecraft》,但在一些小细节上还是存在着肉眼可见的问题。 不过以OpenAI的能力,也不难预见,这些问题都会在未来的版本中不断改进和完善。那么问题来了,小伙伴们,你们怎么看? end 《显卡》《幻兽帕鲁》《模型》《会员》 可以在AMD显卡上跑CUDA软件么? 拉个Box即可渲染超写实单帧!C4D版AI渲染引擎出现了! 《显卡》《幻兽帕鲁》《模型》《会员》