Sora

#工具软件# 0 0
Sora是一款由OpenAI开发的前沿AI视频生成工具,能够将文本描述转化为高质量的视频内容。Sora利用深度学习和自然语言处理技术,支持多种视频生成方式,包括文本转视频、文本与图像结合转视频以及文本与视频结合转视频。用户可以通过简单的文本提示生成长达60秒的视频,这些视频可以包含复杂的场景、角色动作和物理效果。Sora的应用领域非常广泛,包括广告制作、创意视频、实验性艺术作品等。
  • 外文名称: Sora
  • 发布时间: 2024年02月
  • 所属公司: OpenAI
  • 官方网址: 点击查看
详细介绍 PROFILE +

基本介绍

Sora,美国人工智能研究公司OpenAI发布的人工智能文生视频大模型(但OpenAI并未单纯将其视为视频模型,而是作为“世界模拟器”),于2024年2月15日(美国当地时间)正式对外发布。

Sora这一名称源于日文“空”(そら sora),即天空之意,以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。

Sora可以根据用户的文本提示创建最长60秒的逼真视频,该模型了解这些物体在物理世界中的存在方式,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景。继承了DALL-E 3的画质和遵循指令能力,能理解用户在提示中提出的要求。

Sora对于需要制作视频的艺术家、电影制片人或学生带来无限可能,其是OpenAI“教AI理解和模拟运动中的物理世界”计划的其中一步,也标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃。

2024年12月10日,OpenAI正式向用户开放人工智能视频生成模型Sora。12月18日,文生视频大模型Sora入选“2024全球十大工程成就”。

行业背景

OpenAI在大模型领域的成功

2022年底,OpenAI正式推出ChatGPT,这款由人工智能技术驱动的自然语言处理工具能够通过学习和理解人类的语言来进行对话。ChatGPT是OpenAI迈出的第一步,这款让所有人都能体会到人工智能潜力的现象级产品,展现出了文字对于过去人工智能的理解力和逻辑能力的超越。随后,OpenAI的开发重点逐步过渡到图像的生成,Dall-E模型在生成图像方面也获得了重大突破。

视觉算法的进步

视觉算法近年来的突破在泛化性、可提示性、生成质量和稳定性等方面均取得了进展,这预示着技术拐点的临近以及爆款应用的涌现。特别是在3D资产生成和视频生成领域,由于扩散算法的成熟,这些领域受益匪浅。然而,与图像生成相比,3D资产和视频生成在数据和算法方面面临的难点更多。

尽管如此,考虑到大型语言模型(LLM)对人工智能各领域的加速作用以及已经出现的优秀开源模型,2024年该行业有望实现更大的发展。在2023年末至2024年初,Pika、HeyGen等人工智能生成的视频应用逐渐受到关注,这验证了多模态技术的持续进步与成熟。但与此同时,民主倡导者和人工智能研究人员警告说,这些工具已经被用来欺骗和欺骗民众。

名字由来

Sora在日语中是“天空”(そら)的意思,引申含义还有“自由”,象征着其无限的创造潜力。

社会影响

价值意义

Sora对于需要制作视频的艺术家、电影制片人或学生来说,都带来了无限可能。该模型可以深度模拟真实物理世界,标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃,也被认为是实现通用人工智能(AGI)的重要里程碑,通过不断深入研究和发展Sora等先进模型,有望在未来实现更加智能、高效和多样化的视频生成与处理技术。Sora的推出让AIGC(生成式人工智能)再度成为行业焦点,能否彻底“颠覆”行业也成为舆论议论的中心。

产业格局

估值上涨

Sora发布后,OpenAI的估值迅速上涨(有望超过800亿美元,2023年ChatGPT发布不久时其估值约为290亿美元),且文生视频大模型将会大幅推动人工智能基础设施的需求,英伟达、OpenAI、软银等巨头公司都被曝正在进行AI芯片的制造布局,英伟达也因大模型训练需要GPU算力支持而股价大涨。与此同时,受Sora发布的影响,美国图片供应商Shutterstock的股价大跌。

在中国,龙年开市第一天,Sora相关概念全线“爆发”,会畅通讯、当虹科技、万兴科技、易点天下、因赛集团、东方国信、数码视讯、华扬联众、国脉文化等股票均大幅上涨,多家公司回应称,将根据自身业务特点,在文生视频技术落地、Sora应用等方面寻找突破入口。

生产变革

浙商证券预测,Sora及同类产品将参与到改变信息生产和分发两大环节的进程中,PGC(专业生产内容)将广泛采用AI工具辅助生产,UGC(用户生成内容)将借助AI工具逐步替代PGC。此间,AI生成视频工具的商业化将提速。

Sora可生成一段长达60秒的视频,远超市面同类AI产品视频生成时长,60秒的视频时长,已经超过抖音等短视频平台的平均视频时长,Sora的诞生也为以后短视频平台的内容生产提供了更大的可能性。

职业取代

截至2024年2月,已有一些视觉艺术家、设计师和电影制作人以及OpenAI员工获得了Sora访问权限,他们也已开始在社交平台不断晒出使用Sora生成的新作品,为人们展示AI生成视频的创意可能。许多网友称“不少人要丢工作了”,甚至有人开始“悼念”一整个素材行业。

特色功能

功能特色

优点

功能综述

Sora可以快速制作最长一分钟、准确反映用户提示、可一镜到底的视频(其他AI视频工具还在突破几秒内的连贯性),视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景”。

静态图生成视频

Sora还具备根据静态图像生成视频的能力,能够让图像内容动起来,并关注细节部分,使得生成的视频更加生动逼真,这一功能在动画制作、广告设计等领域具有应用前景。

视频扩展与缺失帧填充

Sora能够获取现有视频并对其进行扩展或填充缺失的帧,这一功能在视频编辑、电影特效等领域具有应用前景,可以帮助用户快速完成视频内容的补充和完善。

连接视频

可以使用Sora连接两个输入视频,在具有完全不同主题和场景组成的视频之间实现无缝过渡。

技术特点

多帧预测生成

Sora是一种扩散模型,具备从噪声中生成完整视频的能力,它生成的视频一开始看起来像静态噪音,通过多个步骤逐渐去除噪声后,视频也从最初的随机像素转化为清晰的图像场景,其能够一次生成多帧预测,确保画面主体在暂时离开视野时仍保持一致。

特殊架构

Sora采用与GPT模型相似的Transformer架构,OpenAI用Transformer结构替代Diffusion模型中常用的U-Net结构,提升了原来Diffusion模型在深度和宽度上的可扩展性,为视频模型增加输出时长奠定基础。Transformer架构能够处理长序列数据,并通过自注意力机制捕捉数据中的依赖关系,从而提高模型的生成能力。但为了解决Transformer架构在长文本和高分辨率图像处理上的问题,扩散模型采用更可扩展的状态空间模型(SSM)主干替代了传统的注意力机制,从而减少了算力需求,并能够生成高分辨率图像。

重述提示词

Sora借鉴DALL-E 3的“重述提示词技术”,为视觉训练数据生成高度描述性的标注,这使得模型能够更忠实地遵循用户的文本指令,生成符合用户需求的视频内容,同时也提高了模型的灵活性和可控性。

数据表示

OpenAI将视频和图像表示为Patch,类似于GPT中的token,这种统一的数据表示方式使得Sora能够在更广泛的视觉数据上进行训练,涵盖不同的持续时间、分辨率和纵横比,有助于模型学习到更丰富的视觉特征,提高生成视频的质量和多样性。

原生规模训练

Sora采用“原生规模训练”,过往的图像和视频生成通常会将视频调整为标准大小,但这样会失去视频的原始长宽比和细节,而原生规模的训练方法可以带来更好的效果。Sora可以对各种尺寸和纵横比的视频进行采样,允许直接为不同尺寸的设备创建内容,并快速原型化较低分辨率的内容。与将视频裁剪为正方形的模型相比,Sora可以生成更完整、更美观的视频。

故事板模版

Sora还包含一个名为故事板(Storyboard)的选项,允许用户通过它详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成,用户可以浏览其他人创作的视频集锦。

本百科词条由网站注册用户【 CN108123 】编辑上传提供,当前页面所展示的词条介绍涉及宣传内容属于注册用户个人编辑行为,网站不完全保证内容信息的准确性、真实性,也不代表本站立场。 版权声明 反馈 我要认领
词条所在榜单
最新评论
相关知识文章
十大跑分软件排行 电脑跑分软件哪个好 靠谱的电脑检测软件推荐
电脑跑分,即是利用软件对电脑硬件进行性能测试,分数越高,在一定程度上代表着性能越强。如今电脑配置各不相同,要想更准确的测试出性能如何,得先知道跑分软件哪个好,接下来请跟随maigoo小编一起看看3D Mark、鲁大师、AIDA64、PCMark、FurMark、GPU-Z、CPU-Z、Fritz Chess Benchmark、GeekBench等电脑跑分软件!
十大看图软件排行 看图软件哪个好用 图像查看软件大全
看图软件什么最好?一款看图软件的实用性如何,得看它的图片打开速度、功能数量、支持格式;现在看图软件越来越多,但实际体验差异明显;MAIGOO网编辑就此,为大家筛选了一批好用的看图软件,其中有ACDSee、2345看图王、美图看看、Google Picasa、XNview、ImageGlass、光影看图、Irfanview等,你用过多少?
十大动画制作软件 动漫制作软件盘点 自己做动画的软件有哪些
动画制作分为二维动画与三维动画技术,涉及软件主要分为2D和3D二种类型。在动画行业中制作动画的软件种类越来越多,越来越丰富,你知道哪个动画制作软件比较好用?画动漫软件哪个好?下面MAIGOO小编就为大家介绍十大最好用动画制作软件,分别有Autodesk Maya、Adobe Animate、3DS Max、AE、C4D、Blender、Harmony、Cascadeur‌、TVP、Dragonframe。
七大分屏软件推荐 手机同屏多窗口软件 手机分屏软件哪个好
机分屏软件既能发挥大屏幕的多视角操作优势,又能免去后台应用来回切换的繁琐,一边打游戏一边聊天,足以让效率翻倍;maigoo编辑针对手机分屏技术,盘点了VMOS、多任务分屏、SkyOlin Helper、多屏任务插件、牛轧糖平行窗口、XHFW3、XMultiWindow等安卓分屏软件,一起来看看这些分屏软件的分屏效果如何!
九大刷机软件排行 手机刷机软件哪种好 安卓刷机软件哪个好
刷机分为卡刷和线刷,通过一定的技术手段,为手机重新写入系统;对许多刷机者而言,刷机就是玩机,享受不一样的使用体验,那么市场上的刷机软件哪种好?免费刷机软件有哪些?MAIgoo小编为大家筛选了一批手机刷机软件,其中有奇兔刷机、刷机大师、甜椒刷机助手、卓大师刷机专家、线刷宝、爱思助手、兔兔助手等!
十大建模软件排行榜 3d建模软件有哪些 3d制图软件哪个好
3d建模软件颠覆了传统的2D模式,在游戏、影视、建筑/室内设计、VR/AR、电商、工业设计、军工设计等多个重要领域有着广泛应用,并在一定程度上改变着行业的发展格局,那么在这种大环境下,相关从业者和爱好者有哪些3D制图软件可以使用?3DS MAX、Maya、Rhino、Blender、ZBrush、SketchUp等建模软件效果如何?下面跟随maigoo编辑来看看!
十大好用的手机克隆APP 一键换机助手排名 手机搬家软件哪个好
手机克隆是非常实用的一种手机数据搬家软件,能够将联系人、短信等个人信息,以及照片、音乐、视频等重要数据从旧手机一键导入新手机中。那么手机搬家软件哪个好用?一键换机软件有哪些?下面,买购小编为大家分享十大好用的手机克隆APP,包括华为手机克隆、欢太手机搬家、VIVO互传、小米换机、荣耀换机克隆等等,一起来了解一下吧。
十大画图软件排行 绘图软件都有哪些 画画软件用什么好
近些年,我国绘图软件行业的自主软件品种不断增多,质量不断提升,于2019年达到2250亿元的市场规模,然而面对如今各行各业的需求,国产画图工具能否满足要求呢?国内外哪种制图软件最好用呢?下面跟随MAIgoo编辑一起了解下Photoshop、Illustrator、CorelDRAW、SAI、Visio、Origin、Painter、AutoCAD等热门画图软件!
十大好用的手机测速软件 wifi测速app哪个好 最准的测网速软件
手机测速软件可以帮助你了解当下的网络环境,同时也在一定程度上,体现了一款的手机的网络性能。那么,你知道手机测速用什么软件好吗?本文中,买购网编辑就带大家了解下Speedtest、花瓣测速、测网速UUSpeed,以及全球网测、网络万用表、安兔兔评测、泰尔网测等测速app。下面一起来看看。
十大好用的硬盘分区工具 硬盘分区软件哪个好 磁盘分区软件推荐
硬盘分区软件的作用,就是帮助我们划分硬盘的储存空间,以方便我们管理不同的文件、软件和其它数据。本文中,买购小编就带大家看看硬盘分区软件哪个好,例如傲梅分区助手、DiskGenius、MiniTool分区向导,以及Partition Magic、易我分区大师等电脑硬盘分区工具,都具有一定代表性。下面一起来了解下。
十大好用的电脑清理软件 磁盘清理软件哪个好 电脑垃圾清理软件推荐
在这个信息化时代,电脑已成为人们工作和生活的必备工具。然而软件越来越臃肿,电脑的内存空间也一次次告急。为了保持较好的使用体验,学会使用电脑垃圾清理软件是非常有必要的。那么,你知道现在市面上电脑清理软件哪个好用吗,下面跟随买购小编来了解下CCleaner、WizTree、Glary Utilities、360清理大师-Win10等应用。
十大专业显卡测试软件 显卡测试工具哪个好 显卡性能测试软件推荐
显卡是电脑上最重要的配置之一,其性能强弱影响着电脑综合性能的表现。本文中,买购网编辑就带大家看看日常测试显卡用什么软件。现阶段使用较为广泛的有3D Mark、Unigine Superposition、Furmark,以及GPU-Z、Heaven Benchmark、Geekbench 6、Fraps等。这些显卡测试工具你都用过吗?下面一起来了解下。
十大手机识图软件排行 拍照识图app哪个好用 识图搜图软件推荐
拍照识图软件可以帮助人们快速了解生活中的事物,例如查询植物、商品等;也可以帮助人们找到更高质量的同款图片。本文中MaiGoo小编将和大家看一份手机识图软件名单,其中有形色、百度App、Google Lens,以及万能识图、搜图神器、慧眼识图、搜狗识图等。下面一起来了解下这些识图app和网站。
十大好用的虚拟光驱软件 虚拟光驱工具有哪些 虚拟光驱软件推荐
虚拟光驱软件的作用,就是在电脑上模拟出一个光驱。这个光驱不能直接读取实体光盘,而是通过加载存放在硬盘里的光盘镜像文件来读取信息。本文中,买购小编将带领大家看看虚拟光驱工具有哪些、虚拟光驱软件哪个好,例如DAEMON Tools、Alcohol 120%、UltraISO软碟通、gBurner Virtual Drive等,都较具代表性,一起来了解下。
十大数据分析必备软件 数据分析工具排名 好用的大数据分析软件
数据,可以帮助人们更好地理解事物本质,指导人们的决策。各行各业的发展,都需要大量数据的支撑。本文中,maiGOO小编就和大家一起看看数据分析工具软件有哪些,例如Power BI、Statistics Analysis System、Tableau,以及Mongo DB、Zoho Analytics等,都是较具代表性的大数据分析软件。这些软件你用过哪些,一起了解下。
十大编程软件排行榜 编程开发工具大全 c语言编程软件有哪些
世界上主流的编程语言有C、Java、Python、C++、C#、Visual Basic、PHP等,针对这些编程语言,又有相对应的Visual C++、Visual Studio、Eclipse、Dev-C++、Notepad++、MyEclipse、JDK、Code::Blocks、Gcc、Sublime Text、IntelliJ IDEA、Ultraedit、C-Free等编程软件,被广泛运用,下面跟随maigoo网编辑一起了解下这些编程工具!
十大AI换脸软件排行 视频换脸软件哪个好 ai换脸工具推荐
在人工智能的大潮下,许多ai换脸软件纷纷进入市场,虽然存在隐私问题,但凭借独特的娱乐性,依旧掀起了一股换脸热潮,那么AI换脸软件有哪些?ai换脸工具哪个好?下面,maigoo编辑为大家分享十大AI换脸软件排行榜,包括DeepFaceLab、Faceswap、Openfaceswap、FakeAPP、Swapface、Remaker、Reface等热门换脸p图软件,一起来了解下吧。
七大去马赛克软件排行 视频去马赛克软件哪个好用 马赛克去除工具推荐
马赛克是使用频率最高、使用范围最广的一种图片/视频处理手段,涉及新闻、动漫、电影、连续剧、写真等方面。作为一种具备了数十年历史的处理技术,马赛克沿用到今天有什么破解方法呢?Maigoo小编为此盘点了一批去除马赛克的软件,其中有JavPlayer、Video Enhancer、DeepCreamPy、TecoGAN、Face Depixelizer、EnhanceNet等视频马赛克去除工具,一起看看!
十大好用的AI视频生成软件推荐 ai一键生成视频工具有哪些
在这个数字化时代,视频内容已成为吸引观众的最强大工具之一,随着AI技术的发展,用AI生成视频的工具越来越多,那ai一键生成视频工具有哪些比较好呢?Maigoo小编为大家带来了十大好用的AI视频生成软件推荐,如:Runway、Pika、Sora、Genmo、Stable video diffusion、Dream Machine、Pixverse等,一起来看看吧。
十大调色软件推荐 手机调色软件排行榜 配色软件app哪个最好
在互联网社交越来越发达的今天,各类拍照修图产品层出不穷,而伴随人脸识别、大数据等技术的成熟,修图软件App的功能亦更加完善,玩法更加多样。在这个社交看颜值的年代,Vsco、Snapseed、Lightroom、MIX滤镜大师、泼辣修图等手机调色软件也理所当然的受到了欢迎,那么这些照片调色软件有何独特之处,下面和maigoo小编一起看看!