• AI

    苹果突然放弃造车!马斯克发声,为什么十年造不出一台车?

    尽管电动汽车被广泛认为是汽车行业未来的主导力量,但近期市场需求的疲软和不断变化的市场环境,迫使许多车企开始重新思考他们的战略方向。「龙头老大」特斯拉暂缓了墨西哥工厂的建设,通用和本田也紧随其后,宣布终止他们的入门级电动汽车合作计划。同时,通用汽车还放弃了其原定至 2024 年中期在北美生产 40 万辆电动汽车的目标,并且砍掉了数十亿美元的预算。

  • AI

    刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

    机器之心报道机器之心编辑部 一键生成可玩游戏世界。 Sora 问世才不到两个星期,谷歌的世界模型也来了,能力看起来更强大:它生成的虚拟世界「自主可控」。 刚刚,谷歌定义了生成式 AI 的全新范式 —— 生成式交互环境(Genie,Generative Interactive Environments)。Genie 是一个 110 亿参数的基础世界模型,可以通过单张图像提示生成可玩的交互式环境。 我们可以用它从未见过的图像进行提示,然后与自己想象中的虚拟世界进行互动。 不管是合成图像、照片甚至手绘草图,Genie 都可以从中生成无穷无尽的可玩世界。 Genie 由三个部分组成:一个潜在动作模型,用于推断每对帧之间的潜在动作;一个视频 tokenizer,用于将原始视频帧转换为离散 token;一个动态模型,用于在给定潜在动作和过去帧 token 的情况下,预测视频的下一帧。 看到这项技术发布,很多人表示:谷歌又要来领导 AI 技术了。 谷歌还提出,Genie 学到的潜在动作可以转移到真实的人类设计的环境中。在这个假设基础上,谷歌针对机器人视频训练了一个 Genie 模型,作为机器人领域潜在世界模型应用的概念验证。 被颠覆的游戏、设计、XR、机器人行业…… 我们可以从四个维度来理解 Genie 的革命性意义。 首先,Genie 可以在没有动作标签时学习控制。 具体来说,Genie 借助大量公开的互联网视频数据集进行了训练,没有任何动作标签数据。 这本来是一个挑战,因为互联网视频通常没有关于正在执行哪个动作、应该控制图像哪一部分的标签,但 Genie 能够专门从互联网视频中学习细粒度的控制。 对于 Genie 而言,它不仅了解观察到的哪些部分通常是可控的,而且还能推断出在生成环境中一致的各种潜在动作。需要注意的是,相同的潜在动作如何在不同的 prompt 图像中产生相似的行为。   其次,Genie 可以培养下一代「创作者」(creator)。 只需要一张图像就可以创建一个全新的交互环境,这为生成和进入虚拟世界的各种新方法打开了大门。例如,我们可以使用最先进的文本生成图像模型来生成起始帧,然后与 Genie 一起生成动态交互环境。 在如下动图中,谷歌使用 Imagen2 生成了图像,再使用 Genie 将它们变为现实: Genie 能做到的不止如此,它还可以应用到草图等人类设计相关的创作领域。   或者,应用在真实世界的图像中: 再次,谷歌认为 Genie 是实现通用智能体的基石之作。以往的研究表明,游戏环境可以成为开发 AI 智能体的有效测试平台,但常常受到可用游戏数量的限制。 现在借助 Genie,未来的 AI 智能体可以在新生成世界的无休止的 curriculum 中接受训练。谷歌提出一个概念证明,即 Genie 学到的潜在动作可以转移到真实的人类设计的环境中。 最后,谷歌表示,Genie 是一种通用方法,可以应用于多个领域,而不需要任何额外的领域知识。 尽管所用数据更多是 2D Platformer 游戏游戏和机器人视频,但该方法具备通用性,适用于任何类型的领域,并可扩展到更大的互联网数据集。 谷歌在 RT1 的无动作视频上训练了一个较小的 2.5B 模型。与 Platformers 的情况一样,具有相同潜在动作序列的轨迹通常会表现出相似的行为。 这表明 Genie 能够学习一致的动作空间,这可能适合训练机器人,打造通用化的具身智能。   技术揭秘:论文《Genie: Generative Interactive Environments》已公布 谷歌 DeepMind 已经放出了 Genie 论文。   论文地址:https://arxiv.org/pdf/2402.15391.pdf 项目主页:https://sites.google.com/view/genie-2024/home?pli=1 论文的共同一作多达 6 人,其中包括华人学者石宇歌(Yuge (Jimmy) Shi)。她目前是谷歌 DeepMind 研究科学家, 2023…

  • Web

    眨个眼就学会了 Pixi.js

    当今的Web开发中,图形和动画已经成为了吸引用户注意力的重要手段之一。而 Pixi.js 作为一款高效、易用的2D渲染引擎,已经成为了许多开发者的首选~~(我吹的)~~。 本文将介绍PixiJS的基础知识和使用方法,希望可以光速入门,掌握 Pixi.js 的用法。

  • 国际风云

    俄乌冲突两周年:十大影响,八大启示

    编者按:2月21日,由中国人民大学重阳金融研究院(人大重阳)主办,中国人民大学全球治理研究中心、中国人民大学中美人文交流研究中心承办,中国人民大学区域国别研究院合办的第十届(2024年春季)全球治理论坛“俄乌冲突两周年:影响与启示”在北京成功召开。会上发布三份重磅研究报告。其中人大重阳“全球治理”系列研究报告第18期《俄乌冲突两周年:影响与启示》 (点击蓝色字体可下载报告全文) 由中国人民大学重阳金融研究院俄乌冲突追踪研究课题组撰写。2月21日 北京日报 发布报告全文,深圳卫视“关键洞察力” 栏目就报告内容、俄乌冲突两周年等相关话题采访中国人民大学重阳金融研究院执行院长、俄乌冲突追踪研究课题组组长 王文,获得广泛关注。 现将报告全文及采访视频发布如下: ▲ 报告封面 引言 2024年2月24日是俄乌冲突爆发两周年。俄乌冲突作为冷战以来最大的国际事件,对于世界格局的演进和全球秩序的变化已经且将产生深远影响。在安全领域 ,俄乌冲突之后出现更多地缘冲突,世界陷入二战后最混乱的安全局势; 在 社会领域 ,俄乌冲突造成一场巨大的人类悲剧,是二战结束以来欧洲伤亡人数最多的战争; 在 规则领域 ,俄乌冲突助推贸易、金融“泛武器化”趋势,世界出现有史以来最激烈的制裁与反制裁潮; 在 政治领域 ,俄乌冲突加剧全球阵营化对抗,世界出现冷战结束以来最大的国家群体分裂; 在 观念领域 ,俄乌冲突成为全球进一步分裂的催化剂,诱发冷战后世界的思想大分流; 在 经济领域 ,俄乌冲突加速全球供应链重构,全球供应链遭遇二战结束以来的最大动荡; 在 科技领域 ,俄乌冲突凸显高科技对国家安全的至关重要性,成为人类有史以来最大规模的一轮高科技试验; 在 能源领域 ,俄乌冲突分化全球绿色转型进程,气候治理面临自20世纪70年代以来的最大拖延; 在 金融领域 ,俄乌冲突导致国际货币格局多极化的量变累积进程加快,全球资本市场出现2008年以来的最大动荡; 最后,在 全球格局 上,俄乌冲突加速推进“百年变局”,国际社会进入二战结束以来从未见过的 “大争之世” 。在上述影响之下,对于中国来说,要把握俄乌冲突下时代变革的主要特征和中长期趋势,充分做好国际国内应对。一是人道主义危机加剧 ,中国须在适度备战的前提下,积极参与国际安全秩序构建,践行全球安全倡议; 二是 东西方阵营割裂世界 ,中国应坚持真正的多边主义,增强在外交博弈中的灵活性; 三是 “认知战”制胜于无形 ,中国须加强对“认知战”的博弈能力建设,提升话语叙事能力; 四是 “冷战式经济格局”再露端倪 ,中国应主动制定重塑经济全球化的规则秩序; 五是 科技实力已成为国家安全的决定性因素 ,中国须大力提升科技自主创新程度,推动科技开放与合作; 六是 全球绿色低碳转型一段时期内将继续被边缘化 ,中国应增强能源韧性; 七是 国际金融市场面临的不确定性上升 ,中国须加快金融业强身固本,建设金融强国; 八是 国际秩序变革的斗争性、漫长性和残酷性日趋凸显 ,中国须做好持久战准备。

  • 国际风云

    俄乌局势对中国的启示

    2022年2月24日,俄罗斯总统普京下令在乌克兰展开“特别军事行动”。两年来,这场冲突在全球引起了极为强烈而持久的关注。   战火还在燃烧,尚未看到结束的迹象。如何评价当前的冲突现状?目前阻碍和平的重要因素有哪些?这场冲突该何去何从呢?怎样结束才能让各方的损失都降到最低?俄乌冲突对全球的安全形势、政治、经济等有哪些影响?对中国有什么启示?   中国人民大学重阳金融研究院执行院长、中美人文交流研究中心执行主任王文在长安街知事 (微信ID:Capitalnews) “知事会客厅”直播节目( 回放 )中分析,俄乌冲突是中国崛起可能面临西方全面压制的一次预演和演习,在观察、思考、研究、剖析这场冲突中,可以从中学到三个重要方面的经验,即反制裁能力、珍惜和平,以及保持战略冷静与战略定力。   视频截图 这场持久冲突可能“印巴化” 知事:本周六(2月24日)是俄乌冲突爆发两周年,目前俄乌战火还在燃烧,尚未看到结束的迹象。您如何评价目前的冲突现状?   王文:在21日的第十届全球治理论坛上,人大重阳发布了研究报告《俄罗斯未来重塑,中国可积极引导》,这份报告基于我们在过去两年来五次赴俄罗斯共21个城市的调研,核心观点就是俄乌冲突未来会如何发展。 过去40多年,我们一直享受着和平红利,缺乏对战争的直观感受。我在克里米亚亲历了空袭,那种恐惧让我对战争有了更深刻的认识。 对于俄乌冲突的未来发展,我首先要强调人文关怀的重要性。在这场冲突中,每一颗子弹背后都可能是一个家庭的破碎,因此我们需要更多的同情心和关怀。 至于冲突的持续时间,我过去两年的预测已经被验证,冲突很可能会演变成一场“持久战”。我对冲突的短期结束持悲观态度,中期来看,可能会“印巴化”,变得同印度、巴基斯坦一般,最终在实际控制区设立停火线;长期来看,它可能会持续3年、5年、10年,甚至更久。在外交层面上,我们呼吁西方国家停止向乌克兰提供军事援助,因为这只会导致更多的死伤。 2月20日,顿涅茨克地区阿夫杰耶夫卡,俄乌冲突持续,受伤的乌克兰军人从阿夫杰耶夫卡撤离后,他们的军事装备堆积在撤离点。 知事:俄乌各自的诉求其实是一个无法调和的悖论,您认为美西方想要一个什么样的结果?   王文:美西方的目标很简单,通过冲突完全打垮俄罗斯,甚至瓜分俄罗斯,这已经是公开的秘密。美国前国务卿希拉里·克林顿曾表示,“西伯利亚太大,不能由俄罗斯独自管理”,明显是在挑衅,暗示要瓜分西伯利亚。希拉里还鼓动俄罗斯的加盟共和国独立,以此分裂俄罗斯,削弱潜在的竞争对手。 我去过俄罗斯21个城市,东南西北中都跑了一圈,发现大多数俄罗斯人已经放弃了对西方的幻想。美国国务卿布林肯在2月17日的慕尼黑安全会议上的发言更是撕碎了所有的面具,他说“你不在餐桌上,就在菜单上”,其用心昭然若揭。 2月17日,德国慕尼黑,美国国务卿布林肯在慕尼黑安全会议的小组讨论会中发言。 这场冲突显露了赤裸裸的国际竞争,表明现实主义的“你死我活”的国际竞争仍然存在。西方的战略目标之一是通过乌克兰拖住俄罗斯,再通过俄罗斯来压住欧洲,使欧洲完全倒向美国。通过塑造敌人,来实现大西洋联盟的重新团结。 另一方面,通过这场冲突,西方取得了一些蝇头小利,包括能源和军工方面的利益。美国军工股价上涨,武器销量大增,而通过炸毁“北溪”管道,美国取代了欧洲与俄罗斯之间的能源往来,能源、军工都赚得盆满钵满。 最后谁遭殃?这场冲突的最大输家是乌克兰,乌克兰人民遭受了重大伤害。其次俄罗斯也受到了制裁的影响,欧洲是第三个输家,是不明智的参与者,缺乏战略智慧,导致物价飞升、通胀高企,自主性丧失,实在是得不偿失。 知事:虽然美国近期放缓了援乌进程,但欧洲国家却异常主动,不仅英法高官近期频访乌克兰,法国总统马克龙还和德国总理朔尔茨一道,重申继续为乌克兰提供财政支持的立场。您如何看待欧洲援乌的主动性?   王文:欧洲国家渴望保持对世界的领先地位,延续过去百年的辉煌。然而,从硬实力的角度看,欧洲正陷入困境,缺乏大型互联网公司和手机品牌,电子商务和智能科技在全球竞争中逐渐失宠。连曾经强大的汽车业,如德国的BBA(奔驰、宝马、奥迪),也在新能源汽车崛起中受到冲击。 欧洲似乎缺乏务实主义的情怀,无法看到全球战略发展的方向。特别是在乌克兰问题上,欧洲的情怀似乎过于理想主义。一项数据显示,在乌克兰前线士兵中,女性的比例已经达到24%,这让人不禁想问,等到男人、女人都打光了,儿童是不是也要上前线?欧洲是真心关心乌克兰吗?为什么这时候不关心乌克兰的女性和儿童,反而让她们成为战争的牺牲品? 许多欧洲的智库学者把援助乌克兰视为政治正确,这种思维导致欧洲在政治决策上缺乏真正的战略视野。从中国人的角度来看,援助是否合理应该是一个可以讨论的话题,而不是一种政治正确的观点。世界政治需要回归到务实主义的轨道,更关心社会大众的切实利益。 2024年2月16日,法国巴黎,法国总统马克龙和乌克兰总统泽连斯基在巴黎爱丽舍宫签署双边安全协议。   今年开启和谈的可能性不大 知事:您觉得今年有可能会开启和谈吗?   王文:今年开启和谈的可能性不大。实际上,2022年4月,双方已经开始和谈,5月甚至准备签署停战协议。然而,美国在那个夏天提供更多军备装备,并敦促乌克兰重新发动进攻。在美国的军事援助下,乌克兰于9月发动了大规模反攻。 去年5月,欧洲再次增加援助并要求乌克兰继续反攻,然而至今未见实质进展。每当和谈出现时,西方,包括欧洲和美国,都倾向于加大军事援助,希望乌克兰继续打下去。 美国政客更强调,这是一场成本低廉的战争,因为美国在冲突中没有死伤,仅花费几百亿美元就能压制俄罗斯。所以实际上美国并不愿意结束冲突,和解对美国而言并无好处,他们不想轻易放弃这一优势。泽连斯基也不愿意和解,因为这可能意味着他的政治生命终结。 总体来说,西方不太可能让冲突停止,因为这对其是有利的。对乌克兰人民来说,这场战争令人同情,而且在短期内很难看到结束的迹象。2024年,如果特朗普重新上台,尽管他声称会取消对乌克兰的军援,但实际操作可能并不容易,因为冲突对美国有一定利益。 知事:最后这场冲突该何去何从呢?怎样结束才能让各方的损失都降到最低?   王文:中国对于俄乌冲突的影响及其走向存在深刻思考。尽管有人声称“中国是这场冲突的赢家”,但实际上中国在多个方面受到了冲击。首先,中国在乌克兰的大量投资和港口受到了负面影响,损害了实际利益。其次,西方的舆论战渲染称“中国在背后支持俄罗斯”。第三,冲突的持续可能导致粮食和能源安全方面的国际波动。 中国是全球维护和平的力量,希望俄乌冲突能够和平解决。然而,冲突结束的路径并不容乐观。目前,西方陷入僵局,难以找到解决方案。在这种情况下,希望俄乌双方领导人以及国际社会都能够更加务实地思考,最终形成一种妥协,解决当前的困境。 知事:但可以肯定的是,俄乌双方都不能实现他们最初的目标了。   王文:是的,战争永远没有全胜之说,中国古代就有了“善战者不言战”的智慧。真正伟大的将军或政治家通常会采取“先胜后战”的策略,正如孙子兵法所言,不战而屈人之兵是最高明的。战争往往是最后的政治手段,是当你在政治手段上无法达成共识时的无奈之举。 知事:纵观两年来的战况演进、外交博弈,您认为俄乌冲突对全球的安全形势、政治、经济等有哪些影响?   王文:在人大重阳发布的《俄乌冲突两周年:影响与启示》报告中,我们提出了俄乌冲突的十大影响。在安全领域,俄乌冲突之后出现更多地缘冲突,世界陷入二战后最混乱的安全局势。据英国国际战略研究所的最新统计数据,2023年全球冲突数量达183起,创近30年之最。 在社会领域,俄乌冲突造成一场巨大的人类悲剧,是二战结束以来,欧洲死亡人数最多的战争。 在规则领域,俄乌冲突助推贸易、金融“泛武器化”趋势,世界出现有史以来最激烈的制裁与反制裁潮。一方面,金融武器化,结局是去美元化加剧;另一方面,贸易武器化,结果美欧高通胀高债务低增长。 在政治领域,俄乌冲突加剧全球阵营化对抗,世界出现冷战结束以来最大的国家群体分裂。 在观念领域,俄乌冲突成为全球进一步分裂的催化剂,诱发冷战后世界的思想大分流。 在经济领域,俄乌冲突加速全球供应链重构,全球供应链遭遇二战结束以来的最大动荡。 在科技领域,俄乌冲突凸显高科技对国家安全的至关重要性,成为人类有史以来最大规模的一轮高科技实验。 在能源领域,俄乌冲突分化全球绿色转型进程,气候治理面临自20世纪70年代以来的最大拖延。 在金融领域,俄乌冲突导致国际货币格局多极化的量变积累进程加快,全球资本市场出现2008年以来的最大动荡。 在全球格局上,俄乌冲突加速推进“百年变局”,国际社会进入二战结束以来从未见过的“大争之世”。   俄乌冲突的三点启示 知事:近期,巴以冲突吸引了更多的全球关注。对于西方世界来说,他们如何看待、比较俄乌和巴以这两场冲突的?   王文:我认为西方,尤其是美国,在对待俄乌冲突和巴以冲突时表现出了明显的双重标准和对人权关切的放弃。西方认为以色列在战场上的激烈行动是合法捍卫主权,而对俄罗斯则视为“国家恐怖主义”。不仅如此,美国还接连否决安理会涉巴以决议。这反映了西方在处理国际事务时的不一致和严重的双重标准,以及出于所谓利益而放弃对人权真正关切的现实。 从更深层次讲,这反映出西方文明缺乏灵活性。在西方文明里,只存在两元对立,恶就永远恶,善就永远善,然后就可以以善自居,代表善来消灭对方。西方政客也常常将中国揣摩成黑暗和邪恶,这恰恰是因为他们的文明基因里出现了太多令人不齿和过于简单化的事情。 美国目前作为全世界最强大的国家,应该反思自己到底给这个世界带来了什么?过去二十年,美国外交有没有给世界作出过实质性贡献?一件都没有。 2月20日,美国纽约,全球采取行动组织的活动人士呼吁美国停止支持以色列在加沙的战争。 知事:在俄乌冲突的两年中,出现了许多的“出乎意料”。比如俄罗斯在美西方的金融制裁下,卢布先跌又涨;西方企业撤出俄罗斯后,俄国内的实体经济反而得到了发展,国内产供链也没有紊乱;而且“全球南方”国家并没有站队西方一起制裁俄罗斯。您如何看待这些“出乎意料”?俄乌冲突对于中国有哪些启示?   王文:在观察、思考、研究、剖析这场冲突中,有三个重要方面的经验。 第一是借鉴反制裁能力:西方对俄罗斯实施2万多次制裁,但俄罗斯成功展现了强大的反制裁能力。俄罗斯央行灵活应对,特别是卢布结算令,对抗制裁并保持相对稳定。 第二,提醒国人要珍惜和平。战争不是儿戏,必然伴随悲剧。所以我们要珍爱和平,要创造各种条件维护和平,同时发展更强大的手段来遏制战争,不战而屈人之兵。 第三,保持战略冷静与战略定力。在面对挨打和被诱骗打别人的可能性时,要保持战略定力,使中国更强大,通过不断推进改革和开放来提升国家实力,维护国家安全,使强国之路更顺,这是我们这一代人的使命。   来源:长安街知事(作者 刘晓琰) 监制:张力 编辑:苏越

  • 国际风云

    撤资浪潮之后:在俄外企情况、俄方应对及对我启示

    韩炎峰,丁一凡,翟东升 核心提要 美国及其盟友占退出俄罗斯市场公司的绝大多数,民众对俄态度、在俄盈利能力与资产类别影响着各国企业留存率。 截至2024年2月2日,共有352家外国企业完全退出俄罗斯市场,其中五眼联盟、欧盟及日韩国家完全撤离了328家企业,占撤离企业的绝大多数。 从民众舆论角度出发,美西方国家民众对俄罗斯的观点态度与各国企业撤离俄罗斯的情况存在一定相关性。民众对俄厌恶程度与企业撤离率有正相关关系。 从公司经营角度出发,盈利水平高或重资产占比大的公司更不愿脱离俄罗斯市场。 舆论压力、经济制裁与军事冲突本身都对在俄企业经营造成了阻碍。 耶鲁大学、基辅经济学院等美西方及乌克兰的机构对在俄企业进行了统计跟踪,利用舆论压力敦促企业撤出俄罗斯市场。 物流混乱停滞、贸易结算困难、出口禁令制裁成为了在俄企业经营的较大阻碍,资本流通限制也使得企业资金转移变得困难。 俄政府通过一系列措施缓解外资撤离冲击,但仍面临阻碍。 俄政府成立了外国投资政府控制委员会,收紧了外资出售条件,并取消“不友好国家和地区”的专利赔偿金,鼓励本土资本收购撤离企业。 此外,俄政府积极进口替代,并通过平行进口规避禁运。 但撤离企业的回购协议一定程度阻碍了友好国家的替代性投资,美西方国家亦已开始针对俄罗斯的应对措施修补制裁漏洞。 外资的退出对俄罗斯本土企业的影响是两面的,这取决于其所在行业的可替代性与替代效率。 一方面,外资在微电子、IT、汽车等行业的撤离对俄罗斯经济和本土企业的正常运转造成了较大的负面影响。俄罗斯的部分农业生产也受到了制裁限制。 另一方面,政府主导了对外资的收购行为,本土资本能够低价收购外资企业,政府也从中抽水,增加了财政收入。在产业壁垒低、可替代性强、国产化率高的行业,外资的退出反而使本土资本受益。 我国应加强对欧经济合作,坚定不移对外开放,重视舆论宣传,并重新评估与美西方国家的相互依赖关系。 中美经济脱钩与加强和欧洲的经济联系并不矛盾,中欧经贸关系的强化会削弱美欧对华政策的协同性。 坚定不移推进对外开放。推动构建与非欧美国家的贸易网络,本身就可以成为美西方经济制裁的阻碍。 公共舆论倾向在经济制裁的实现中不可小觑,专业的外交工作、多元的民间交往与务实的外宣建设缺一不可。 产业的可替代性与禁运的可实施性决定了以其为武器进行经济制裁的有效性,我国应基于此,重新评估与美西方国家的相互依赖关系。 2022年2月24日至今,俄乌冲突已持续近两年之久。在冲突爆发后,美西方国家掀起了史无前例的对俄制裁浪潮。除由政府主导的金融、物流、个人等领域制裁外,美国及其盟国也在全社会范围内掀起了声势浩大的舆论战,将此次军事冲突上升为对西方价值观的攻击,并以舆论压力迫使在俄外资企业撤离俄罗斯。在其势汹汹的经济制裁与社会舆论压力下,诸多在俄企业担心在俄经营成本陡增不下,并背负“资助侵略者”的恶名,进而受到更大的经济损失与经营阻碍。“两害相权取其轻”下,这些企业纷纷暂停对俄投资、缩减在俄规模、从俄罗斯撤资,乃至完全退出俄罗斯市场。俄罗斯也针锋相对地出台了应对措施,以“胡萝卜加大棒”的方式延缓外资撤离的步伐,并减弱其对本国经济民生的影响。 在俄乌冲突爆发两年之后的今天,世界对俄乌冲突的关注度开始逐渐减弱,巴以的军事冲突、朝鲜半岛的紧张局势都促使国际社会的目光从“拉锯战”式的俄乌冲突中移开,对俄围攻的舆论“浪潮”开始缓缓褪去。在这一背景下,我们展开对美西方国家企业在俄情况的梳理,并探究在俄企业所面临的阻碍,以及俄罗斯的应对措施。我们希望这项研究能够使我国更充分地了解美西方国家的对俄经济制裁,并为我国开展对美西方国家外交提供智识支持。 一、美西方国家在俄企业数据统计 截止至2024年2月2日,在基辅经济学院追踪的3708家公司中,共有1614家在俄的外国企业继续运营,占原在俄外国企业比重为43.53%,其余2094家企业的在俄业务均受到了不同程度的影响。共有352家外国企业完全退出俄罗斯市场,占比9.49%。五眼联盟、欧盟及日韩国家完全撤离了328家企业,是退出俄罗斯市场的“主力部队”。 图1:外国企业在俄状态(截至2024年2月2日) 在五眼联盟、欧盟及日韩国家中,德国、美国和意大利企业占据了目前仍在俄正常开展业务的前三名,数量分别为220家、194家和81家。但各国原本在俄进行生意往来的企业基数不同,如美国原在俄企业达760家,数量居全球首位。在原在俄企业达10家以上的国家中,从在俄正常开展业务的企业占比来看,意大利、匈牙利、奥地利、希腊和德国分别占据前五名,占比分别为65.85%、63.16%、59.15%、55.56%和52.76%。这些国家也是上述国家中唯五在俄正常运行企业占比超过50%的。而美国正常开展业务的企业占比仅为25.53%,说明在俄美国企业还是受到了相当程度的影响。 从公共舆论角度出发,美西方国家民众对俄罗斯的观点态度与各国企业撤离俄罗斯的情况存在一定相关性。皮尤研究中心(Pew Research Center)于2023年7月10日发布的调查显示,希腊、匈牙利、意大利、法国和德国的民众在受调研的13个西方国家中的对俄厌恶程度居后五位,而这五个国家在俄企业继续正常运行的占比也偏高(其中法国占比为47.34%)。相对地,13个国家中民众对俄厌恶程度居前五位的国家:波兰、瑞典、西班牙、荷兰和英国,在俄企业继续正常运行的占比也偏低,分别为3.7%、14.49%、35%、28%和29.15%。 图2:部分国家在俄正常运营公司占比与民众对俄态度 从公司经营角度出发,退出的西方企业在盈利能力方面往往表现不佳,并且拥有更多的劳动力资产。一项2023年10月发表的研究显示,欧盟和七国集团退出的在俄公司占全部在俄公司税前利润总额的6.5%,占有形固定资产的8.6%、总资产的8.6%、营业收入的10.4%以及员工总数的15.3%。这一现象符合逻辑,即盈利水平高或重资产占比大的公司更不愿脱离俄罗斯市场。 二、在俄企业所受阻碍 (一)舆论压力。如耶鲁大学对在俄罗斯的外资企业进行了统计,将外资企业在俄罗斯的退出程度分为“A-F”多个等级,并毫不讳言地称其工作“激励”了1000多家公司退出俄罗斯。耶鲁大学也为在退出承诺中“食言”的公司单独开辟了一个页面,并将400家持续在俄运营的大型跨国公司列为“失责400强”(The Feckless 400)。乌克兰的基辅经济学院也在“leave-russia.org”网站上实时更新在俄外资企业的退出与留存状态,并呼吁各企业“停止与俄罗斯的所有业务”。诸多西方主流新闻媒体也对在俄企业的撤出与滞留进行跟踪报道。名为“道德评级机构”(Moral Rating Agency)的网站使用自制的“道德算法”对外国公司撤离俄罗斯的行为进行打分,并对各公司的行为给予有明显倾向性的评价标签。这些行为给相关在俄企业带来了较大的社会舆论压力。 (二)经济制裁与军事冲突。日本贸易振兴机构简报的调研显示,物流混乱停滞、贸易结算困难、出口禁令制裁高居在俄日企面临困难的前三名。事实上,美西方国家的对俄制裁并不能要求本国跨国公司从俄罗斯撤资,因为这与联合国与经合组织的规范违背。但制裁本身显然会给在俄跨国企业带来许多经营问题。另外,资本流动的限制使得企业很难将资金转移到国外。这类问题不仅仅影响来自对俄“不友好国家和地区”的公司——例如,印度石油公司汇回约6亿美元俄罗斯股息的意图便实现得异常艰难。 三、俄罗斯的应对措施及潜在问题 (一)成立俄罗斯联邦外国投资政府控制委员会,收紧外资企业出售条件。在最初的制裁冲击过后,俄罗斯政府成立了外国投资政府控制委员会,负责审批对本国“不友好”司法管辖区的外资企业出售行为。俄罗斯政府要求相关企业折价出售,并向政府缴纳资金。如果折价低于90%,则金额至少为评估报告中资产市场价值的5%,否则需提供10%。据英国《金融时报》报道,委员会每月开会3次,每次审议不超过7份申请。俄罗斯政府通过折价与控制企业售出数量,减缓了外资流出速度。 (二)取消“不友好国家和地区”的专利赔偿金。2022年3月6日,俄政府修改了法律中关于专利赔偿金的规定。根据新的规定,如果专利持有人来自“不友好国家和地区”,其发明、实用新型或工业设计在未经授权的情况下被使用,则所需支付的赔偿金额为生产和销售商品、完成工作和提供服务的实际收益的0%,即无需为非授权使用专利做出任何赔偿。 (三)将外国企业资产本国化,以继续营运。2022年3月9日,俄立法机构批准对来自“不友好”国家外资持股比例超过25%的在俄企业,进入收归国有的外部托管程序。外部管理将持续3个月,之后俄政府会将这些企业拍卖。企业如果在法院下令后的5天内重启在俄业务,收归国有程序将暂停。部分宣布退出的外国企业也将在俄资产折价出售给了俄罗斯本土资本。如在2022年6月,麦当劳将在俄业务出售给了本土授权商Alexander Govor,并更名为“Вкусно – И Точка”(俄意“美味,就是这样”)。经历短暂磨合后,新品牌已超过了麦当劳的先前业绩。 (四)积极进口替代,或寻求替代的外国供应商。在餐饮和低端制造业等领域,俄罗斯本国供应商迅速占领了被美西方国家品牌抛弃的“领地”。俄在线零售商Lamoda为国内制造商提供整合支持,推出的“Showroom”版块汇集了俄本土公司的女装和男装。在汽车工业方面,俄罗斯国有汽车制造商Avtovaz正逐步对汽车零部件进行进口替代以规避西方制裁,进而提高产量。 另外,随着制裁国企业的退出,对俄友好的外国供应商开始扩张,这也缓解了相关行业的退出冲击。比如,俄乌战争爆发后,俄罗斯市场一度出现了汽车严重短缺的窘境,但中国的汽车产业随后开始在俄大规模扩张。在2022年2月,中国汽车品牌在俄份额为9%,11月增至31%,2023年11月的市场份额已达58%。长城汽车和吉利集团已经成为了俄汽车市场第二和第三大生产商。 (五)通过平行进口等方式规避贸易制裁限制。2022年3月9日,俄政府出台的第506号法令允许了“平行进口”,即无须在目标国家享有知识产权的权利人授权,就可以将产品进口至国内。2023年12月25日,俄政府决定延长平行进口合法至2024年,同时缩减进口范围。这一措施缓解了贸易制裁带来的社会经济冲击,并为俄罗斯提供了推进替代生产的时间。值得一提的是,走私已经成为了维持俄罗斯军工产出的重要渠道:基辅经济学院和叶尔马克-麦克福尔专家组估计,自2022年2月以来,俄罗斯军事零部件进口仅下降了9%。 俄罗斯的应对措施也面临诸多问题,比如: (一)回购协议等因素让替代厂商进入俄罗斯市场态度犹豫。回购协议保障了暂离企业重返俄罗斯的机会与权益,但却无形中阻碍了俄罗斯利用相关企业产能的意愿。据笔者私人渠道了解,俄方曾试图联系中资汽车制造企业接手撤出企业的工厂,以实现产能的再利用。但由于存在原企业回购的风险,中资企业担心投资亏损,故而谢绝了合作请求。 (二)制裁国对转口贸易漏洞的修补。欧盟第九轮制裁已经试图补上外资公司利用转口贸易规避对俄制裁的漏洞。制定的一揽子计划特别允许欧盟实施限制向第三国出售或出口敏感两用商品和技术的措施,即如果欧盟看到某种计算机芯片对一个国家的出口增加了五倍,且该国对俄罗斯的此类出口增加了大致相同的数量,那么欧盟将能够采取更严厉的行动来结束这种做法。这种“堵窟窿”的行为会给俄罗斯与外资企业的合作造成更大阻碍。 四、外资退出对俄罗斯本土企业的影响 通过分析外资企业退出俄罗斯后所带来的影响,我们得出的结论是,外资退出未必是对俄罗斯的打击,这取决于其所在行业的可替代性与替代效率。就俄罗斯实际情况而言,外资的退出对其本土企业的影响是两面的。 外资在微电子、IT、汽车等行业的撤离对俄罗斯经济和本土企业的正常运转造成了较大的负面影响。在这些外资流出最严重的领域,俄罗斯45%-50%的设备依赖进口,且在不同程度上缺乏替代生产能力。如由于缺乏替代性的IT技术解决方案,甲骨文、微软、亿磐、思科等科技巨头的退出导致俄罗斯一半以上的行业失去了技术支持,1/4企业的服务成本大幅增加。 2022年,俄罗斯的汽车产量下降了67%,2023年回升了16%,但仍逊于制裁前的状况。俄罗斯汽车工业一直严重依赖海外投资、设备和零部件,外资撤出导致的工厂闲置与缺乏替代性的零部件是其产量下降的主要原因。俄罗斯副总理兼工业和贸易部部长曼图罗夫在1月15日的会议指出,汽车产业的首要任务仍然是扩大汽车零部件的生产。 违反常识的是,外资撤离也对俄罗斯的农业生产带来了阻碍。俄罗斯的种子自给率仅为60%,其中95%的甜菜种子自荷兰进口,马铃薯种子的80-85%也依靠进口。俄罗斯需种植1.5倍规模的甜菜,才能达到制裁前产量。 外资退出对俄政府及本土企业也存在经济利益层面的正面影响。政府主导了对外资的收购行为,本土资本能够低价收购外资企业,政府也从中抽水,增加了财政收入。梅德韦杰夫曾嘲笑丹麦啤酒巨头嘉士伯,感谢他们增加了俄罗斯的预算。“强劲的预算意味着对前线的帮助,在这方面,愚蠢的丹麦人也为俄罗斯现代武器做出了贡献。”俄政府显然发现了这一点,表现为在俄外资回购协议的签署变得越发困难。 从行业角度看,在产业壁垒低、可替代性强、国产化率高的行业,外资的退出反而使本土资本受益。如麦当劳、星巴克等跨国餐饮企业被俄罗斯本土资本收购,其经营活动几乎没有受到影响,却无需给国外资本分配利润。俄罗斯快餐企业家米哈伊尔·冈察洛夫曾认为麦当劳无法被替代,因为“俄罗斯现在没有人拥有类似复杂性和系统的业务”。但事实上,作为一个98%供应商均为俄罗斯本土企业的餐饮连锁店,本土化后的麦当劳2022年营收总额仅下降了2.3%,目前的营收已经赶上了原品牌的水平。 时尚产业外资的退出对本土企业而言,则是彻底的好消息。时尚咨询集团(Fashion Consulting Group)的数据显示,2022年俄罗斯时尚龙头企业的销售额增长了约10%-20%,其中Melon Fashion Group的净利润增长达121%。文化塑造的产业壁垒在经济战中毫无战略价值,这一道理在此次制裁中显现得淋漓尽致。 五、外国公司的若干应对途径 跨国公司以逐利为目的,退出俄罗斯市场对许多企业而言本身就是一个艰难的选择,尤其是较为依赖俄罗斯消费者的公司。如德国家族巧克力品牌Ritter Sport承诺停止在俄罗斯的投资和广告,但仍在该国销售其产品,因为该公司总收入的7%来自俄罗斯,退出俄罗斯市场将承受巨大的伤害。另外,规模较小的公司或社会关注度不高的公司也并不需要担心负面舆论影响,因而能够在俄继续运营。联合利华拒绝停止在俄销售产品,被各大新闻媒体争相批判,但默默无闻的小公司显然不会有此“待遇”。此外,诸多与俄罗斯有生意往来的跨国公司也利用了若干应对措施,来确保自身重返俄罗斯的能力,或继续在俄罗斯市场进行生意往来。 (一)签订资产回购条款。2022年10月12日,日产汽车宣布退出俄罗斯市场,并出售旗下在俄约6.862亿美元的资产。日产汽车的低价转售导致其出现了约1000亿日元(约合人民币49亿元)的非正常亏损,但其有权在六年内重新回购其股份,这为其重返俄罗斯开了一个得到俄政府认证的“安全后门”。韩国现代汽车也如法炮制,董事会在2023年12月19日批准折价出售了圣彼得堡工厂所有股权给俄罗斯汽车经销商Avilon旗下的Art-Finance。但同时,现代附加了2年内可回购的条款,这为其在地缘冲突结束后重新进入俄罗斯市场留有余地。 (二)通过第三国进行间接贸易。2023年,德国对吉尔吉斯斯坦的汽车和汽车零部件出口增长了5500%,对哈萨克斯坦的汽车和汽车零部件出口增长了720%,对亚美尼亚增长了450%,对格鲁吉亚增长了340%。而相关国家与俄罗斯的贸易额也有所增加。根据中亚分析报告局的数据,2022年1月至10月期间,哈萨克斯坦公司向俄罗斯出口了价值约5.5亿欧元的电子设备,是2021年同期的18倍。这些数据显示,欧洲的部分企业正通过在南高加索和中亚寻找对俄贸易“中转站”来规避制裁。在微电子领域,尽管俄罗斯受到了严重制裁,但其去年还是进口了价值 17 亿美元芯片,其中12亿美元由欧洲与美国的公司制造。土耳其、哈萨克斯坦和阿联酋等未加入制裁的第三国充当了中间商的角色,而欧美公司显然乐见其成。 (三)将公司转让给未对俄实施制裁的第三国。对于第三国而言,对俄制裁反而是拓展俄罗斯市场的良机。美国知名运动品牌锐步(Reebok)与土耳其控股公司Flo Retailing签署了收购协议,Flo Retailing获得了锐步在俄门店的控制权,并将品牌更名为Sneaker Box;芬兰咖啡生产商保力格集团(Paulig Group)将其业务出售给了印度个人投资者维卡斯·索伊(Vikas Soi)。 (四)变更商标或主要商品名称以规避舆论。不少公司有意地规避舆论焦点,通过变更商标或商品名称来实现继续在俄经营。例如,可口可乐饮料现在以“Dobry Cola”(俄语意为“上好的可乐”)品牌在俄罗斯联邦销售,其制造商Multon公司属于可口可乐的全资子公司。百事可乐公司也耍了类似的“把戏”。其停止在俄罗斯生产百事可乐、美年达和七喜等知名品牌的饮料后,开始销售“换汤不换药”的“Evervess-cola”“Frustyle”和“Любимая кола”等品牌的饮料。 (五)“纸上谈兵”式地撤离,抑或将公共利益作为“挡箭牌”。在2022年年初时,许多外资企业因舆论汹汹,不得不宣布将退出俄罗斯。但很大一部分企业仅仅是“光打雷、不下雨”,并不积极推进退出进程,并以各种理由进行拖延。如法国知名网球拍制造商百保力(Babolat)声称已停止与俄罗斯开展所有业务,并停止了与在俄独家经销商的业务往来。然而,声称是百保力附属经销商的当地公司继续销售其产品,且数目早已远超库存;食品制造商亿滋国际(Mondelēz International)在其公告中辩称,暂停全部业务将“切断许多在战争中没有发言权的家庭的部分粮食供应”(尽管该公司主营业务是零食),并为3000多名同事和10000多名农民带来不确定性。如捷迈邦美(Zimmer Biomet)、史赛(Stryker)等医疗设备供应商则以“提供医疗必需品”的人道主义理由来继续在俄罗斯经营。 六、政策建议 (一)中美经济脱钩与加强和欧洲的经济联系并不矛盾,中欧经贸关系的强化会削弱美欧对华政策的协同性。在俄乌冲突中,欧美掀起的舆论浪潮并未实现外资企业的全面撤离,许多欧美企业也通过各种手段规避舆论压力、以继续在俄运营。尤需注意的是,这一事实是俄罗斯对乌发动军事行动、且让欧洲诸国感受到武力威胁后发生的。我国并不存在对欧洲的潜在军事威胁,且与欧洲许多国家的经贸往来程度远甚于俄罗斯。从这一基本条件看,我国有更大的潜力争取西方阵营在涉我议题上的内部分歧。而有针对性的开放正是抵御单边制裁的有力武器,“一荣俱荣、一损俱损”的事实会让许多公司、乃至国家对跟随经济制裁心生抵触。 因此,我国应有意控制对美国与对欧洲诸国的外交“水温”,鼓励中欧经贸往来,必要时可以对美欧相同程度的负面政策给予差异化的反击。另外,从内部政治角度出发,欧洲各国的政治自主符合我国利益,加强与欧洲经济双边联系会对欧洲的独立自主起到促进作用,高度的经济联系也会在台海生变时,成为遏制欧洲倒向美国的动力。 (二)坚定不移推进经济对外开放,推动构建与非欧美国家的贸易网络。在制裁应对中,俄罗斯很好利用了第三国转口贸易来进行制裁规避,而美西方企业也得以借此将商品输送到俄罗斯。对于制裁国而言,相较于直接制裁,次级制裁难度更大、效果更差,且更容易导致本国和第三国之间的矛盾。如果制裁让第三国受益颇丰,这种情况则更容易发生。比如,尽管2023年6月的新制裁措施给予了欧盟对第三国挥舞制裁“大棒”的授权,但欧盟也需要平衡与第三国之间的关系,避免这些国家因丰厚的利润和与欧盟关系破裂而完全倒向俄罗斯。 因此,对于我国而言,加强与欧美国家之外的广大“中间地带”国家的商业往来、改善双方经贸便利程度与我国的营商环境至关重要。与广大非欧美国家高度的贸易连通本身就会成为美西方国家对我经济制裁的潜在阻碍。 (三)公共舆论倾向在经济制裁的实现中不可小觑,专业的外交工作、多元的民间交往与务实的外宣建设缺一不可。美西方国家的政治体系决定了公共舆论是左右其对外政策的重要力量,且社会力量对经济制裁的追随也很大程度上取决于公共舆论的态度。这一观点被欧美国家对俄态度与企业撤出率的数据统计所佐证。在中美对抗已成定局、且美国拥有独步天下的媒体霸权的大背景下,我国急迫需要增进与欧洲诸国在官方与民间层面的交流,以避免欧洲舆论场上只有美国的“一种声音”。这需要放低调门、专业细致的外交工作,丰富多元的二轨交流与民间交往,以及务实且有针对性的对外宣传的通力配合。 (四)重新评估欧美国家与我国的经济相互依赖程度。产业的可替代性与禁运的可实施性决定了以其为武器进行经济制裁的有效性,结合俄罗斯的事实看,诸如时尚、奢侈品等行业对欧美国家的经济战略意义极低,根本无法成为经济制裁中的“手牌”,贸易断绝仅仅会让出口国承受损失;成熟制程芯片虽然无法替代,却因为走私难以禁绝而仍不能卡住俄罗斯军工生产的脖子。 对于我国而言,我国与欧美国家的贸易总量数据固然有一定参考意义,但贸易细项的战略分量不尽相同。我国应按照“料敌从严”的思路,对与欧美国家的贸易进行细致的再评估,摸清彼此的事实相互依赖程度,做到心中有数,避免因信息缺乏导致政策制定失误,进而损害国家利益。 本文作者: 韩炎峰,中国人民大学区域国别研究院助理研究员 丁一凡,中国人民大学全球治理与发展研究院高级研究员 翟东升,中国人民大学区域国别研究院院长 本文系观察者网独家稿件,未经授权,不得转载。

  • Sora

    “打假”Sora,谷歌Gemini 1.5 Pro第一波评测出炉|甲子光年

    Gemini 与 Sora 互相伤害。 作者|刘杨楠 编辑|赵健 OpenAI 与谷歌同一天发布的两款 AI 模型正在“互相伤害”。   先是 OpenAI 的 “世界模拟器” Sora 完全抢走了谷歌最新一代多模态大模型 Gemini 1.5 Pro 的风头,让谷歌这出大招反响平平。谷歌也被戏称为“AI界的汪峰”。   很快,谷歌 Gemini 1.5 Pro 就来给 Sora “拆台”了。   一名谷歌董事将一条 Sora 生成的视频发给 Gemini 1.5 Pro,让其点评一下。Gemini 1.5 Pro 犀利指出了视频中不合逻辑的地方——   这段视频是在日本一条雪街上拍摄的,樱花盛开。有一些不一致之处表明这段视频可能是由人工智能生成的。   首先,雪花纷纷扬扬地飘落,但樱花依然盛开。樱花通常在春天盛开,当天气温暖而没有雪。   其次,雪以非常均匀的方式下落,这并不是雪在现实生活中通常下落的方式。   第三,视频中的人们没有穿任何冬季衣物,尽管下着大雪。   总的来说,这个视频在视觉上很吸引人,但不一致之处表明这不是一个真实场景。   谷歌应该是最有实力改变大模型格局、给 OpenAI 带来压力的玩家。这次与 Sora 互相拆台的 Gemini 1.5 Pro,实力究竟如何?       1.第一波评测出炉,Gemini 1.5 Pro 表现如何? 谷歌 Gemini 1.5 Pro 是一个多模态模型,可以为不同模态执行高度复杂的理解和推理任务,同时可以在更长的代码块中执行更相关的问题解决任务。   不过,Gemini 1.5 Pro 目前尚未对公众开放,仅有少数用户加入内测,AI 工具库网站 Therundown.ai 创始人 Rowan Cheung 便是其中之一。   2月19日,Rowan Cheung 在 X 上发布了 Gemini 1.5 Pro 的六项能力测评。   1.分析和理解长视频   Rowan Cheung 上传了前一晚 NBA 扣篮大赛的整个视频,并询问哪个扣篮得分最高。   Gemini 1.5 凭借其出色的长上下文视频理解能力,能够从视频中找到得分最高的完美50分扣篮及其细节!   2. 理解和比较《星际穿越》《星际探索》的完整电影剧本   Gemini 1.5 能够理解、比较并对比这两部电影的完整剧本,帮助…

  • Sora

    Sora爆火48小时,大佬们怎么看?

    本文来自微信公众号: 智东西(ID:zhidxcom) ,作者:程茜、ZeR0,编辑:心缘,原文标题:《Sora爆火48小时:杨立昆揭秘论文,参数量或仅30亿》,题图来自:视觉中国 OpenAI新爆款Sora的热度持续发酵,在科技圈的刷屏阵仗都快赶上正月初五迎财神了。 智东西2月17日报道,这两天,OpenAI首款文生视频大模型Sora以黑马之姿占据AI领域话题中心,马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁、周鸿祎、李志飞等科技人物纷纷下场评论,一些视频、影视、营销从业者也关注起这个新工具,开始担心自己的饭碗。 OpenAI CEO萨姆·阿尔特曼在社交平台X上积极与网友互动,马斯克感叹“人类愿赌服输”,360集团创始人、董事长兼CEO周鸿祎预言“AGI实现将从10年缩短到1年”。身为竞争对手的AI文生视频创企Runway联合创始人兼CEO Cristóbal Valenzuela也被惊到发表感言。 技术大牛们则开动脑力,从有限资料中抽丝剥茧,推演Sora的技术配方。Meta首席AI科学家杨立昆称,纽约大学助理教授谢赛宁作为一作的扩散Transformer论文是Sora的基础。谢赛宁也积极发长文分析Sora基于DiT架构、可能用到谷歌NaViT技术,推算Sora参数量约30亿。 一些OpenAI技术人员还在持续放出更多用Sora生成的视频作品,如海上自行车比赛、男人向巨型猫王鞠躬、鲨鱼跳出海面吓到在海滩的人……‍‍‍ 民间高手们同样行动力惊人:有的将OpenAI展示的生成视频示例的提示词输入到Midjourney、Pika、RunwayML、Make-A-Video等其他明星模型对比效果;有的把Sora和比它早几个小时发布的谷歌最新力作Gemini 1.5 Pro玩起了联动。 Sora的爆火,再度坐实了阿尔特曼“营销大师”的称号。 一些网友怀疑阿尔特曼是专挑谷歌发Gemini 1.5的时间亮出Sora,硬生生把手握100万tokens技术突破的Gemini 1.5话题度杀到片甲不留,是一出用大型广告秀吸引更多融资的高招。 而最新被曝出的消息,似乎印证了OpenAI对新融资的迫切。据外媒报道,随着新一笔要约收购交易完成,OpenAI的估值或超过800亿美元。 阿尔特曼宏大的7万亿美元芯片筹资计划也亟待输血,毕竟最近刚给他的小目标再加1万亿美元,并收获了马斯克的评论。 这样看来,利好的还是AI infra和芯片企业。 一、大佬们怎么看Sora? 不管是震惊Sora的强大,还是吐槽其生成视频的破绽,都能收获极高的关注度。大佬们也分为几派,从不同角度对Sora进行点评。 1. 吃瓜感慨派:时间不等人,甘拜AI下风 代表之一是马斯克,在社交平台X上的各网友评论区活跃蹦跶,四处留下“人类愿赌服输(gg humans)”“人类借助AI之力将创造出卓越作品”等只言片语。 AI文生视频创企Runway联合创始人兼CEO Cristóbal Valenzuela感慨后浪拍前浪,以前需要花费一年的进展,变成了几个月就能实现,又变成了几天、几小时。 出门问问创始人李志飞在朋友圈感叹:“LLM ChatGPT是虚拟思维世界的模拟器,以LLM为基础的视频生成模型Sora是物理世界的模拟器,物理和虚拟世界都被建模和模拟了,到底什么是现实?” 2. 展望预言派:OpenAI还有武器,创企压力倍增 周鸿祎发了一条长微博和一个视频,预言Sora“可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具”,认为OpenAI“手里的武器并没有全拿出来”“中国跟美国的AI差距可能还在加大”“AGI不是10年20年的问题,可能一两年很快就可以实现”。 美国旧金山早期投资人Zak Kukoff预测:一个不到5人的团队将在5年内用文生视频模型和非工会的劳动力。制作一部票房收入超过5000万美元的电影。 GitHub Copilot主创Alex Graveley则替生成式AI创企们捏了把汗:“如果OpenAI打算继续逐个行业地蚕食AI初创公司,他们应该尽快上市。构建一个只有500人受益的新经济是个糟糕的未来。” 前阿里副总裁、正在AI infra赛道创业的贾扬清,评价简单粗暴:“真的非常牛。”他认为“对标OpenAI的公司有一波被其他大厂fomo(害怕错过)收购的机会”“开源还需要一段时间才能catch up”,算法小厂“要不就算法上媲美OpenAI,要不就垂直领域深耕应用,要不就开源”,并预言“infra的需求继续会猛增”。 3. 上手体验派:比较多个视频生成模型,联动Sora和Gemini 1.5 知名连续创业者Gabor Cselle在测试关于美丽东京白雪皑皑的提示词后,得出的结论是Sora在长镜头上表现得更好。 Gabor Cselle还让谷歌Gemini 1.5 Pro观看并分析评论了OpenAI Sora制作的视频。 Sora的原提示词是:“美丽、白雪皑皑的东京市熙熙攘攘。镜头穿过熙熙攘攘的城市街道,跟随几个人享受美丽的雪天,在附近摊位上购物。绚丽的樱花花瓣随雪花在风中飞舞。” Gemini 1.5 Pro给出的评论是:“这段视频拍摄的是日本一条下雪的街道,樱花盛开。有一些不一致的地方表明视频可能是AI生成的。首先,雪下得很大,但樱花还在盛开,樱花通常开在春天,那时天气温暖,没有雪;其次,雪以一种很均匀的方式落下,这与现实生活中的雪通常不同;第三,尽管下着雪,视频中的人没有穿任何冬天的衣服。总的来说,这段视频在视觉上很吸引人,但前后矛盾之处表明这不是真实场景。” 4. 技术分析派:Sora或有30亿参数,基础论文被扒‍‍‍‍‍ 含金量最高的当属围绕Sora核心技术的讨论。 PyTorch创始人Soumith Chintala从视频推测Sora是由游戏引擎驱动的,并为游戏引擎生成组件和参数。 英伟达高级研究科学家Jim Fan评价Sora是“视频生成的GPT-3时刻”“数据驱动的物理引擎”,认为它通过一些去噪、梯度下降去学习复杂渲染、“直觉”物理、长镜头推理和语义基础等。 多伦多大学计算机科学AI助理教授Animesh Garg夸赞OpenAI做得好,评价Sora像是“模型质量的飞跃,它不需要快速的工程来实现随时间一致的RTX渲染质量生成”。 纽约大学助理教授谢赛宁高赞Sora是“难以置信的、将重塑视频生成社区”,并发表多篇推文进行分析,推测Sora建立在扩散Transformer模型之上,整个Sora模型可能有30亿个参数。 值得一提的是,Meta首席AI科学家杨立昆转发评论称他的前同事谢赛宁和他的前伯克利学生、现任OpenAI工程师的William Peebles前年合著的扩散Transformer论文,显然是Sora的基础。 论文地址:arxiv.org/abs/2212.09748 杨立昆还特意指出,这篇论文曾因“缺乏新颖性”而被计算机视觉学术顶会之一拒收。 下一章将附上大牛们更全面的技术分析。 二、每个视频都能挑出错,Sora为什么还能这么火? OpenAI在发布Sora的博客文章下方特意强调其展示的所有视频示例均由Sora生成。比起OpenAI的承诺,更能证明Sora清白的是这些视频中出现的各种生成式AI“灵魂错误”。 比如,随着时间推移,有的人物、动物或物品会消失、变形或者生出分身;或者出现一些违背物理常识的闹鬼画面,像穿过篮筐的篮球、悬浮移动的椅子。 这些怪诞的镜头,说明Sora虽然能力惊人,但水平还不够“封神”。这也给它的竞品和担心工作被取代的人类留下了进化的余地。 毕竟,AI视频生成已经断断续续火了一年多,而当前最晚出场的Sora,就算是错漏百出,也已经在时长、逼真度等方面甩开同行一条街。 主要视频生成模型/技术对比(来源:东吴证券) 让机器生成视频,难点在于“逼真”。比如一个人在同一个视频里的长焦和短焦镜头里外观不会变化;随着镜头转动,站在山崖上的小狗应该跟山崖保持一致的移动;咬一口面包,面包就会少一块并出现牙印……这些逻辑对人来说似乎显而易见,但AI模型很难领悟到前一帧和后一帧画面之间的各种逻辑和关联。 首先要强调下生成式AI模型跟传统信息检索的区别。传统检索是按图索骥,从数据库固定位置调取信息,准确度高,但不具备举一反三的能力。而生成式AI模型不会去记住数据本身,而是从大量数据中去学习和掌握生成语言、图像或视频的某种方法,产生难以解释的“涌现”能力。 OpenAI在技术报告里总结了一些以前模型常用的视频生成和建模方法,包括循环网络、生成式对抗网络、自回归Transformer和扩散模型。它们只能生成固定尺寸、时长较短的视频。 而Sora实现了将Transformer和扩散模型结合的创新,首先将不同类型的视觉数据转换成统一的视觉数据表示(视觉patch),然后将原始视频压缩到一个低维潜在空间,并将视觉表示分解成时空patch(相当于Transformer token),让Sora在这个潜在空间里进行训练并生成视频。 接着做加噪去噪,输入噪声patch后Sora通过预测原始“干净”patch来生成视频。OpenAI发现训练计算量越大,样本质量就会越高,特别是经过大规模训练后,Sora展现出模拟现实世界某些属性的“涌现”能力。 这也是为啥OpenAI把视频生成模型称作“世界模拟器”,并总结说持续扩展视频模型是一条模拟物理和数字世界的希望之路。 令技术大牛们兴奋的焦点就在这个能力上。 扩散Transformer模型论文第一作者谢赛宁发表了多篇推文,分享对Sora技术报告的看法: 先看架构,构建于扩散Transformer(DiT)模型上,DiT=[VAE编码器+ ViT + DDPM + VAE解码器]。 其次是视频压缩网络,看起来只是一个训练原始视频数据的VAE(一个ConvNet),Token化可能在获得良好的时间一致性方面发挥重要作用。 谢赛宁回顾说,在研究DiT项目时,他和Bill没有创造“新颖性”,而是优先考虑了简单和可扩展性。 简单意味着灵活。他认为人们经常忽略掉一件很酷的事,当涉及到处理输入数据时,如果让模型方式更灵活。例如在MAE中,ViT帮助我们只处理可见patches,而忽略掩码patches;类似的,Sora“可通过在适当大小的网格中安排随机初始化的patches来控制生成视频的大小”,而UNet并不直接提供这种灵活性。 他猜测Sora可能还会使用谷歌的Patch n’ Pack(NaViT),使DiT适应各种分辨率/持续时间/宽高比。‍ 论文地址:arxiv.org/abs/2212.09748 可扩展性是DiT论文的核心主题。就每Flop的时钟时间而言,优化的DiT比UNet运行得快得多。更重要的是,Sora证明了Dil扩展定律不仅适用于图像,也适用于视频——Sora复制了在DiT中观察到的视觉扩展行为。 谢赛宁推测在Sora报告中,第一个视频的质量相当糟糕,怀疑它使用的是基本模型尺寸,并做了个粗略计算:DiT XL/2是B/2模型的5倍GFLOPs,所以最终的16X计算模型可能是DiT-XL模型大小的3倍,这意味着Sora可能有大约30亿个参数——如果是真的,这不是一个不合理的模型大小。这可能表明,训练Sora模型可能不需要像人们预期的那样多的GPU——预计会有非常快的迭代。 在他看来,关键的收获来自“新兴的模拟能力”部分。在Sora之前,我们并不清楚长期的一致性能否独立出现,或者它是否需要复杂的主题驱动生成流水线,甚至是物理模拟器。OpenAl已经证明,虽然不完美,但这些行为可以通过端到端训练来实现。但还有两个要点尚未讨论: 1. 训练数据:完全没有谈论训练来源和构建,这可能只是暗示数据可能是Sora成功的最关键因素。 2. (自回归)长视频生成:Sora的一个重大突破是能够生成非常长的视频。制作2秒视频和1分钟视频的区别是巨大的。 在Sora中,这可能是通过允许自回归采样的联合帧预测来实现的,但一个主要挑战是如何解决误差积累并保持质量/一致性。一个非常长的(和双向的)条件作用环境?或者扩大规模可以简单地减轻这个问题?谢赛宁认为这些技术细节可能非常重要,希望在未来能被揭开神秘面纱。…

  • Sora

    Sora爆火!人工智能将如何影响世界?

    清澈灵动的眼眸、活泼可爱的萌宠、神秘莫测的海底世界、熙熙攘攘的夏日街区、充满科技感的魔幻都市…… 这段场景逼真、色彩丰富、氛围浓厚的短视频,全部由人工智能系统制作生成。 近日,美国开放人工智能研究中心OpenAI发布首个视频生成模型“Sora”。该模型通过接收文本指令,即可生成60秒的短视频。 而一年前,同样是这家研究中心发布的AI语言模型ChatGPT,让文本撰写和创作、检查代码程序等都变得易如反掌。 AI聊天、AI绘画、AI音乐……随着一系列AIGC(利用人工智能技术生成内容) 相继问世,让众人直言对现代社会生活产生颠覆性影响的“AI革命”正式来临。 AI究竟有哪些“本领”?为何它每一次迭代升级都能引发全球热议? 生成式AI可将输入内容 变成小说、 电影、艺术作品 谷歌公司旗下的人 工智能模型 “巴德”,可以根据你输入的多个词语迅速生成一篇短篇小说或诗歌。 今年2月,谷歌公司宣布“巴德”更名为“双子座”(Gemini)。这是一款多模态大模型,可理解和组合文本、代码、音频、图像和视频等不同类型的信息。 “巴德”用几个月的时间阅读互联网上几乎所有内容,并开发大语言模型,给出的答案就来自语言模型而并非网络搜索。 DALL-E 可以把你输入的任何内容变成艺术作品。 为了训练DALL-E,研发公司为它提供了约6亿张来自互联网的标签图片。 通过深度学习,它不仅可以理解单个物体,还可以学习不同物体之间的关系。 利用Runway , 你在几秒钟内就能生成平时需要数日才能完成的视觉效果。 该公司创始人巴伦苏埃拉直言,有了生成式AI的加持,未来电影制作的门槛和成本将大大降低。 生物医疗、无人驾驶、气象预报…… AI技术市场规模巨大 除了在艺术创作领域,AI技术在医药领域、城市服务、气象预告的应用也十分值得关注。 1月29日,美国知名企业家马斯克表示,他旗下的脑机接口公司“神经连接”完成首例脑机接口设备人体移植,移植者状态良好。据悉,这项技术是完全可植入的,由电池供电且是无线,全程通过蓝牙连接。 清华大学官网1月30日发布消息,该校医学院脑机接口研究团队与首都医科大学宣武医院联合,于2023年10月成功进行全球首例无线微创脑机接口临床试验。 这位因车祸造成脊髓损伤、四肢瘫痪14年的患者,经术后三个月康复训练,已实现自主喝水等脑控功能,抓握准确率超过90%。  虽然脑机接口技术依旧面临许多挑战甚至质疑,但毋庸置疑的是,人工智能在医疗领域,特别是根据医学影像进行诊断方面取得显著成就。目前,美国食品和药物管理局已批准约420种涉及成像的算法,主要用于癌症治疗。这些算法的准确率可达80%至90%。 除了医学领域,生成式AI也将更广泛参与到城市公共服务、气象预报实践中。 库马尔是印度的一名卡车司机。他在高速公路跑车时,一个往返就是60小时,长时间疲劳驾驶很容易发生交通事故。如今,他的工作旅途中多了一个“不会说话”的小伙伴,随时提醒他避免疲劳或注意车距。 这是一台集合AI和计算机视觉驱动技术的终端设备。 朝向外的摄像头可以测算车辆和其他物体间的距离关系。朝向司机的摄像头则会监控司机的行为和状态,如果司机打电话或者昏昏欲睡,设备就会提醒司机注意正确驾驶。 2023年7月,华为云盘古气象大模型正式上线欧洲中期天气预报官网 ,让世界看到中国大模型破解气象领域难题的能力。 世界银行估计,改进天气预报和早期预警系统每年不仅可带来价值1620亿美元的收益,还可以挽救约23000人的生命。  此外,目前AI人工智能在促进教育公平,应对老龄化社会方面也发挥着越来越重要的作用并形成巨大的市场规模。据彭博社预计,生成式AI的市场规模将在2032年扩大至1.3万亿美元。 AI生成欺骗性内容 干扰选举 或在国家大选期间制造混乱 AI技术带来许多新机遇的同时,也不可避免造成前所未有的挑战和隐患。其中,人工智能生成欺骗性内容干扰选举被认为是全球面临的重要挑战。 当地时间1月23日,2024年美国总统选举共和党党内初选在新罕布什尔州举行。在此之前,很多美国选民都表示,自己接到一通“来自美国总统拜登的电话”。 这通电话以拜登的口头禅“真是一派胡言”开头,建议选民不要给特朗普投票,而是把选票留到11月大选时投给民主党。随后,白宫新闻秘书皮埃尔澄清说,这是一则伪造的电话录音。 分析人士担心,在美国选民容易受到错误信息影响的当下,人工智能可能会在大选期间制造出更多混乱。 据不完全统计,2024年全球将有70多个国家或地区举行重要选举,覆盖超过全球半数人口。在刚闭幕的第60届慕尼黑安全会议上,全球多家科技企业就签署协议,承诺将在2024年打击旨在干扰选举的人工智能滥用行为。 人工智能的应用方式 要充分遵守伦理规则 工业和信息化部赛迪研究院数据显示,2023年,我国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。制造业、零售业、电信行业和医疗健康等四大行业的生成式人工智能技术的采用率均取得较快增长。 专家预测,2035年生成式人工智能有望为全球贡献近90万亿元的经济价值,其中我国将突破30万亿元,占比超过四成。 如何看待未来人工智能的发展? 中国互联网协会副理事长、伏羲智库创始人李晓东分析,人工智能经历六七十年的发展,目前被广泛应用到科技创新、文化产业和工业制造等领域。算力提升和成本降低,也让通用人工智能来到普通百姓的身边。 可以预见在不久的将来,人工智能将无处不在,推动信息化技能从数字化、网络化,全面进入到智能化时代。 “很快我们将不再讨论人工智能,因为人工智能已经融入到生活中,无处不在。”李晓东说。 从某种意义上讲,对人工智能的利用将会在国家之间、机构之间,甚至包括人与人之间形成新的代差和新的数字鸿沟,并推动人类从农业文明、工业文明走向数字文明。因此 能否充分学习和利用人工智能会对人类产生分化,甚至对人类文明产生巨大影响。 AI快速发展,监管将面临哪些挑战? 李晓东表示,“ 数据获取+应用方式”是AI监管的两大问题。 合理合法获取数据对人工智能至关重要,人工智能的应用方式也要充分遵守伦理规则。这 两个核心问题如果处理不当,将会严重影响人工智能的发展和利用。 从数据获取方面看 ,采集和获取不仅涉及到数据的产权问题,还涉及到国家安全和个人隐私。 如何合理合法获取数据,对于人工智能至关重要。 此外, 如何有效联通数据故障,促进数据交换共享,提升数据之间的互操作能力也是人工智能的治理重点。否则,没有持续数据支撑的人工智能发展将会严重受损。 从人工智能的应用方式来看 , 人工智能以前所未有的方式展现其强大的信息处理能 力,其本质是提升人类对信息的利用效率和效果。而人类社会有其基于特定国家和文化的法律法规和道德约束,人工智能发展也要充分遵从法律法规和道德伦理。 目前,部分人工智能技术确实对传统道德伦理及既定法律法规产生冲击,并产生全球性新的伦理规范和规则。 而在规则规范形成过程中,要保持积极互动跟踪,推动伦理规范和全球规则朝着向上的轨道前行。 ▌ 本文来源:央视新闻微信公众号(ID:cctvnewscenter) 监制/李浙  主编/马文佳编辑/马玮璐 校对/高少卓 部分图片/视觉中国 ©央视新闻