以下是本周AI新闻及工具内容:
视频生成平台发布Mochi1
本周,视频生成平台詹某发布了「Mochi1」,一个全新的文本转视频模型,被誉为“最强的开源视频模型”。
Mochi1采用Apache 2.0协议,允许开发者基于该模型创建新产品。由于模型权重较大,Demo还提供了磁力链接便于下载。
首发基础模型支持480p分辨率的视频,HD高清版即将推出,支持720p分辨率。基础模型支持每秒30帧的视频生成,具备高时间连贯性和逼真的运动表现。Genmo官网演示链接:Mochi1
轻量级开源视频模型Allegro
Rams推出了一个轻量级开源文本转视频模型「Allegro」,支持720p分辨率和15帧每秒的视频生成,时长可达6秒。
Allegro可以处理大规模视频数据,允许数据多维分类,有助于模型训练和微调。它使用Date架构,增强了上下文和运动方式的理解。
Stable Diffusion 3.5发布
Stability推出Stable Diffusion 3.5模型,包含large(8B参数)、large Turbo(高效)、和medium(2.5B参数)三种变体。
SD 3.5具备快速生成图像的能力,支持商业化应用,且可以在消费级显卡上流畅运行。Confi UI已宣布支持该模型。
Runway推出Act One角色动画工具
Runway发布了「Act One」,一种生成式角色表演工具,能将视频转换成虚拟角色动画,保持情感和口型同步。
用户只需一个摄像头,即可将眼神、面部表情等迁移至新角色。Act One功能将在Zhen 3 Alpha版本中提供,并将在近期向所有用户开放。
ideogram Canvas图像生成平台
ideogram推出Canvas功能,包括Magic Fill(魔法填充)和Extend功能。用户可以遮罩指定区域,输入提示词来生成风格一致的图像,或对图像进行无缝扩展。
artificialanalysis
artificialanalysis推出视频模型竞技场,用户可为视频评分和投票。目前,Minimax的海螺模型位居第一,支持流畅的文本转视频和图像转视频功能。
Haiper2.0发布
Haiper 2.0支持文本转视频和图像转视频,生成4K分辨率的高质量视频,并将加入关键帧功能以实现更加流畅的生成效果。
Dreamcut视频编辑和录屏工具
Dreamcut通过Cloud创建的智能视频编辑和录屏工具支持智能缩放、文本转语音、噪声移除等多种实用功能。
智源研究院开源EMU3模型
智源研究院发布EMU3 Stage One图像模型,支持图像生成和视觉理解的多任务,简化了模型架构但推理速度较慢。
领取专属 10元无门槛券
私享最新 技术干货