新澳门六合彩内幕潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

发布日期：2024-12-22 04:52 点击次数：182

裁剪部发自凹非寺新澳门六合彩内幕

量子位 | 公众号 QbitAI

奥特曼说，Sora代表了视频生成大模子的GPT-1时刻。

从开年到刻下，国表里、初创独角兽到互联网大厂，都纷繁干预视频生陋习模，带来一个个簇新模子的同期，视频、影视行业也随之发生剧变。

不可否定，当下的视频生成模子还遭受诸多问题，比如对空间、对物理限定的贯通，咱们都期待着视频生成的GPT-3.5/4时刻到来。

在国内，有这么一家从加快试验动身的初创公司，正在为此尽力。

它等于潞晨科技，首创东谈主尤洋博士毕业于UC伯克利，后赴新加坡国立大学担任校长后生解释。

本年潞晨科技在加快贪图规模除外，建树视频生成模子VideoOcean，为行业带来更具性价比的礼聘。

在MEET 2025现场，尤洋博士也向咱们共享这一年关于视频生陋习模的贯通与默契。

MEET 2025智能改日大会是由量子位主持的行业峰会，20余位产业代表与会磋商。线下参会不雅众1000+，线上直播不雅众320万+，获取了主流媒体的豪爽关怀与报谈。

中枢不雅点梳理视频生成模子应该结束考究化文本适度、苟且机位/苟且角度、变装一致性、作风定制化3年后八成就能迎来视频生成的GPT-3.5/GPT-4时刻视频生成大模子的一个平直利用价值等于冲破履行的适度，极大裁减果然场景复现难度。

（为更好呈现尤洋的不雅点，量子位在不转变情愿的基础上作念了如下梳理）

3年后或是视频大模子的GPT-3.5时刻

今天相等喜悦来到量子位大会，相等喜悦和全球疏导，今天讲一下咱们在视频大模子规模作念的一些责任。

最初是我和我的创业公司潞晨科技的先容。我从UC伯克利毕业到新加坡国立大学任教，很行运创办了潞晨科技。

咱们之前是作念算力优化的。2018年谷歌打造了宇宙上第一个千卡集群TPU Pod，那时宇宙上最大的模子还是BERT。咱们匡助谷歌，将（那时）宇宙上最大模子的试验时分从3天压缩到76分钟。

也很行运，旧年华为盘古大模子的一个责任亦然咱们一王人来作念的，并获取了ACL最好论文。咱们的技能匡助华为盘古大模子在试验中更高效。微软、英伟达等公司团队也使用了咱们的技能作念一些踱步式试验，咱们但愿让大模子试验更快、老本更低。

步入今天的话题，来重心先容一下视频生成大模子。

咱们打造了一个居品叫Video Ocean，刻下正处在测试阶段。先来先容一下居品，背面再探讨我合计视频大模子将会如何发展。

最初，我合计视频大模子第一个迤逦的方面是，它应该能够结束考究化的文本适度。

其实咱们今天都在用AI去生成大模子了，咱们细则但愿它能够精确反应出念念要的东西。但很缺憾，比如刻下用文生图APP去生成图移时，还是会发现许多图片实质无法作念到精确适度，是以我认为这方面还有很大的发展空间。

在Video Ocean模子试验历程中，咱们作念了一些初步探索。一个相比好的例子，咱们能够精确地提供一些描画，戴着墨镜，长的胡茬的欧洲男东谈主。不言而谕这个视频内部如实是咱们念念要的阿谁嗅觉，蓝天、海岸、沙滩、背光、单手捏相机、玄色T恤，也有对着镜头言语。

我认为AI视频大模子改日3年可能最迤逦的还是结束视频大模子的Scaling Law。

这个历程不需要相等炫酷的居品才调，最迤逦的是把它的模子与履行宇宙的联贯才调作念到极致。我合计最终形态等于东谈主们说一段话、给一段描画，它能精确地把描画以视频的花样展示出来。

是以我合计改日3年，AI视频大模子就像山姆·奥特曼说的那样，今天是Video的GPT-1时刻，可能3年后到视频大模子的GPT-3.5、GPT-4时刻。

这里展示一下Video Ocean的Demo，刻下咱们作念到了这么的水平。

潞晨科技

，赞687

第二点是改日视频大模子若何能够结束苟且机位、苟且角度。

刻下拍电影、拍记录片可以拿入部属手机、录像机不停地晃，念念如何晃就如何晃，这么是对镜头有果然适度的。改日AI视频大模子，最初应该作念到这少许，雷同的描画，换一下角度、换一个镜头，它的形象是不应该转变的，它等于雷同一个物体。

更进一步讲，改日AI视频大模子还能颠覆许多行业。比如刻下看足球、看篮球赛，咱们看到的镜头是现场编导给咱们看的镜头。他给咱们看出路、近景。

改日能不成依靠AI视频大模子，东谈主来适度镜头，决定念念要看哪，十分于在通顺场里可以片刻移动，移动到教育席、终末一滑、第一滑。苟且机位、苟且角度的适度。我合计改日AI视频大模子在这方面也犀利常重要的，天然天然Video Ocean刻下作念了一些尝试，初步成果还是可以的。

我合计第三点迤逦的是变装一致性。

因为作念出AI视频大模子，最终细则是需要产生营收、结束变现的。谁会愉快为这个付费，比如告白责任室、告白商、电商博主、影视行业。如若深切这些行业的话，一个重要点是变装一致性。

比如一个居品的告白，细则重新到尾这个视频中的穿着、鞋、车，容貌不成有太大变化，物体变装保捏一致性。

拍一部电影，从着手到收尾，主演的容貌、重要副角的容貌细则也不成变化，在这方面Video Ocean也作念一些很好的探索。

再一个是作风的定制化。咱们知谈刻下演员东谈主工老本犀利常贵的，谈具老本也很高。

改日3年之内，如若AI视频大模子浮浅发展，我嗅觉会有一种需求，比如一个导演可以让一个演员在拍浮池里拍一段戏，然后拿到素材通过AI将它转成泰坦尼克场景下的拍浮，转成阿凡达场景下的拍浮，这种才调反而是AI最擅长的。赋予电影感、艺术感的画面。

总之大模子一个平直的利用价值等于冲破履行的适度，能够极大裁减果然场景复现的难度。

而且一捐就是1亿韩元，相当于50万人民币！

可能之前全球听过一个段子，好莱坞导演念念制造一个爆炸镜头，他算了一下预算，第一种决策是盖一个城堡把它炸掉，第二个决策是用贪图机模拟这个画面。老本算下来之后，发现这两种决策的老本都很高，那时用贪图机模拟的老本更高，刻下AI等于要大幅裁减大模子关于生成电影的老本。

如若这少许结束后，咱们可以不受时局、天气等外部身分的适度，并减少对果然演员的依赖。这倒不是抢演员的饭碗，因为一些重要镜头犀利常危境的，比如演员跳飞机、跳楼，演员去缓助行将引爆的炸弹之类，这种镜头改日只需要演员的身份和肖像权，AI可以把这么的镜头作念好，是以对电影行业能够极大作念到降本增效。

正如昆仑万维方汉淳厚刚才说的，天然咱们的贪图资源有限，关联词咱们发现通过更好的算法优化如实能够训出更好的成果，比如Meta使用6000多个GPU试验30B的模子，最近咱们会在一个月内发一个10B版的模子，咱们仅用了256卡。

Video Ocean前身是咱们团队先打造了一个Open-Sora的开源居品，这个开源居品是王人备免费的，在Github上，成果相等可以，比如好意思国独角兽Lambda labs作念了一个火爆的利用数字乐高，其实这个数字乐高级于基于Open-Sora作念的。

本年年头Sora出来之后，各式短视频巨头都对视频大模子这一块相比疼爱，比如中国的快手、抖音，好意思国等于Instagram、TikTok、SnapChat，这可以看到SnapChat的视频模子也在早些时候发布了，叫Snap Video，这是它的官方论文，他们就援用了咱们试验视频大模子的技能，是以说这些技能也匡助一些巨头简直把视频大模子训得更快，精度更高，智能进度更高。

谢谢全球！

点击https://video.luchentech.com可体验Video Ocean更多详备才调

— 完 —

量子位 QbitAI · 头条号签约

关怀咱们新澳门六合彩内幕，第一时分获知前沿科技动态

上一篇：澳门六合彩-玄武版 1月6日东说念主民币对好意思元中间价报7.1876元上调2个基点

下一篇：新澳门六合彩内幕这小区救急物业提前“转正”，作念对了什么？

热点资讯

澳门六合彩官网怀宁县雷埠乡：开展优化生养战略关爱计生稀奇家庭拜谒慰问举止 _大皖新闻 | 安徽网

近日澳门六合彩官网，怀宁县雷埠乡卫健办开展优化生养战略关爱稀奇家庭拜谒慰问举止。在拜谒历程中，责任主谈主员深切计生稀奇家庭，挨门进行拜谒慰问，与特扶家庭东谈主员濒临面、心贴心性进行疏导，为他们测量血压，商讨并了解他们近来的形体景色和生涯情况，了解他们的所念念、所盼，饱读吹他们顽强信心，礼服贫乏，同期责任主谈主员还格外请示他们天气转冷，谨记添衣，退换形体。澳门六合彩官网特扶家庭是一类格外的群体，他们有的子女残疾，有的子女因祸害疾病牺牲成为失独家庭，通过这次慰问拜谒举止，但愿他们大略带着这份...

新澳门六合彩内幕 潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025

热点资讯

推荐资讯

新澳门六合彩内幕潞晨尤洋：视频生成的GPT-4时刻，3年后可以见证 | MEET 2025