水帘洞肉桂蜜桃香_下边痒还一直湿漉漉的_交换的日子2-综投网 加入收藏

热点追踪

首页 > 股票频道 > 正文

直接生成16秒高清视频 我国自研视频大模型在京发布

本站整理
      水帘洞肉桂蜜桃香直接生成16秒高清视频 我国自研视频大模型在京发布

只需一段文字指令就能生成一段逼真视频,今年初,文生视频大模型Sora在全球人工智能业内外引发广泛关注。27日,2024中关村论坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。

  记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描述直接生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力。

  清华大学人工智能研究院副院长、生数科技首席科学家朱军说,当前国内视频大模型的生成视频时长大多为4秒左右,Vidu则可实现一次性生成16秒的视频时长。同时,视频画面能保持连贯流畅,随着镜头移动,人物和场景在时间、空间中能保持高一致性。

  在动态性方面,Vidu能生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能在一段画面里实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果。

  “Vidu能模拟真实物理世界,生成细节复杂且符合物理规律的场景,例如合理的光影效果、细腻的人物表情等,还能创造出具有深度和复杂性的超现实主义内容。”朱军介绍,由于采用“一步到位”的生成方式,视频片段从头到尾连续生成,没有明显的插帧现象。

  此外,Vidu还可生成如熊猫、龙等形象。

  据悉,Vidu的技术突破源于团队在机器学习和多模态大模型方面的长期积累,其核心技术架构由团队早在2022年就提出并持续开展自主研发。“作为一款通用视觉模型,我们相信,Vidu未来能支持生成更加多样化、更长时长的视频内容,探索不同的生成任务,其灵活架构也将兼容更广泛的模态,进一步拓展多模态通用能力的边界。”朱军说。

( )【 】( )【 】(1)【1】(9)【9】(6)【6】(4)【4】(年)【nian】(,)【,】(池)【chi】(田)【tian】(决)【jue】(定)【ding】(率)【lv】(创)【chuang】(价)【jia】(学)【xue】(会)【hui】(以)【yi】(政)【zheng】(党)【dang】(形)【xing】(式)【shi】(进)【jin】(入)【ru】(日)【ri】(本)【ben】(众)【zhong】(议)【yi】(院)【yuan】(,)【,】(于)【yu】(是)【shi】(创)【chuang】(立)【li】(公)【gong】(明)【ming】(党)【dang】(。)【。】(陈)【chen】(洋)【yang】(说)【shuo】(:)【:】(“)【“】(在)【zai】(战)【zhan】(后)【hou】(日)【ri】(本)【ben】(政)【zheng】(治)【zhi】(史)【shi】(上)【shang】(,)【,】(公)【gong】(明)【ming】(党)【dang】(是)【shi】(继)【ji】(日)【ri】(本)【ben】(共)【gong】(产)【chan】(党)【dang】(、)【、】(自)【zi】(民)【min】(党)【dang】(之)【zhi】(后)【hou】(的)【de】(第)【di】(三)【san】(个)【ge】(长)【chang】(寿)【shou】(政)【zheng】(党)【dang】(。)【。】(”)【”】  “以前,拆迁农户只能等待安置房,位置、朝向、楼层等由抽签决定,未必是心仪的。”该负责人说,房票新政赋予了安置农户对住房更大的选择权,也缩短了安置时间。同时,房票帮助安置户将自住以外的权益面积在市场中进行交易,并通过补贴节省购房资金,激励了城镇外来务工人员、城中村和城边村原有居民和农村地区等人口进城购房。qMAWP可乐app福引导网站welcome当下所有资源都可以在这找到,网...uZeLC。

用户评论(已有0条评论)

昵称:
表情
发表评论
注:您的评论需要经过审核才能显示哦,请文明发言!
最新评论
暂无评论

7*24小时快讯