Sora的训练受到了大型语言模型(Large Language Model)的启发,这些模型通过在互联网规模的数据上进行训练,获得了广泛的能力。但Sora不同于传统的语言模型,它是一种扩散型变换器模型(Diffusion Transformer)。这意味着Sora能够通过逐步消除视频中的噪声,从一开始看似静态噪声的视频出发,逐步生成清晰的视频内容。与此同时,Sora还具备扩展视频长度的能力,使得已生成的视频能够更加长久地延续。通过预见多帧内容,Sora成功克服了确保视频主体即便暂时消失也能保持一致性的难题。
大模型视频创作引擎(Video Creation Large Model),是一款提供视频生成和视频处理能力的API技术服务。 该服务基于腾讯视频生成大模型等一系列领先的音视频AI技术,支持高质量地生成或处理视频内容。既能帮助专业视频创作者降低制作成本、发现视频创意,又能提升视频社交娱乐的趣味性。可广泛应用于短视频平台、影视制作、广告营销、社交媒体、游戏等领域。