4月28日消息,Sora走红后,掀起了全球AI视频生成竞赛。近日,国内一段人工智能生成的视频引发关注。该视频来自圣树科技与清华大学最新发布的大型视频模型Vidu。
据官方介绍,该模型采用了团队独创的DiffusionandTransformer架构U-ViT,支持一键生成长达16秒、分辨率高达P的高清视频内容。
例如,通过输入“演播室中的一艘船正驶向摄像机”这样的简单命令,Vidu就可以生成效果逼真、镜头连贯的视频。视频的整体质量与Sora相当。
除了生成复杂、细致的场景外,Vidu还可以虚构场景并想象超现实的图像。它具有多镜头语言,可以更好地理解和生成熊猫、龙等具有丰富文化特征的图像。
据证券时报报道,基于机器学习和多模态大模型的长期积累,圣数科技团队用两个月的时间突破了长视频表示和处理的多项关键技术,成功研发并推出了Vidu视频大模型。
公开信息显示,盛数科技成立于年3月,核心团队来自清华大学人工智能研究院。此外,还包括一批来自**大学和阿里巴巴、腾讯、字节跳动等科技公司的技术人才。截至年3月,神数科技员工总数超过70人,其中近90%为研发人员。
圣数科技由清华人工智能公司RealAI、蚂蚁集团和百度发起的BV百度创投联合孵化创立,致力于打造可控多模态通用大模型。去年3月,圣数科技开源了全球首个基于U-ViT框架的大型多模态扩散模型UniDiffuser。
去年6月,圣树科技获得蚂蚁集团、BV百度创投、卓远资本投资的近亿元天使轮融资;8月,完成数千万元天使+轮融资。本轮融资由金秋基金独家投资。
年3月,圣树科技完成新一轮数亿元融资,由启明创投领投,大泰资本、鸿福厚德、智普AI、老股东BV百度创投、卓远亚洲跟投。
《证券时报》报道称,在三轮融资数亿元资金支持下,盛数科技已成为国内多式联运规模化模式中估值最高的初创公司之一。