发布时间:2023-07-09
点击次数: 文生图模型stable diffusion开源后,将「ai艺术」彻底平民化,只需一张消费级显卡即可制作出非常精美的图片。
而文本转视频领域,目前质量较高的只有Runway前不久推出的商用Gen-2模型,开源界还没有一个能打的模型。
最近,Huggingface上有作者发布了一个文生视频模型Zeroscope_v2,基于17亿参数量的ModelScope-text-to-video-synthesis模型进行二次开发。
图片
模型链接:https://huggingface.co/cerspense/zeroscope_v2_576w
相比于原版本,Zeroscope生成的视频没有水印,并且流畅度和分辨率都得到了提升,适配16:9的宽高比。
开发者cerspense表示,他的目标就是和Gen-2进行开源较量,即提高模型质量的同时,还能免费供大众使用。
Zeroscope_v2包括两个版本,其中Zeroscope_v2 567w可以快速生成576x320像素分辨率、帧率为30帧/秒的视频,可用于视频概念的快速验证,只需要约7.9GB的显存即可运行。
使用Zeroscope_v2 XL生成高清视频,分辨率为1024x576,占用约15.3GB的显存。
Zeroscope还可以与音乐生成工具MusicGen一起使用,快速制作一个纯原创短视频。
Zeroscope模型的训练用到了9923个视频片段(clip)以及29769个标注帧,每个片段包括24帧。偏移噪声包括视频帧内对象的随机移位、帧定时(frame timings)的轻微变化或微小失真。
训练期间引入噪声可以增强模型对数据分布的理解,从而可以生成更多样化的逼真视频,并更有效地解释文本描述中的变化。
使用stable diffusion webui
在Huggingface上下载zs2_XL目录下的权重文件,然后放到stable-diffusion-webui\models\ModelScope\t2v目录下即可。
在生成视频时,推荐的降噪强度值为0.66到0.85
使用Colab
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

ChatGPT Writer
免费 Chrome 扩展程序,使用 ChatGPT AI 生成电子邮件和消息。
106
查看详情
笔记链接:https://cola
b.research.google.com/drive/1TsZmatSu1-1lNBeOqz3_9Zq5P2c0xTTq?usp=sharing
先点击Step 1下的运行按钮,等待安装,大约需要3分钟;
图片
当按钮旁边出现绿色复选标记时,继续执行下一步。
图片
点击想要安装模型附近的运行按钮,为了能够在Colab中快速获得3秒左右的剪辑视频,更推荐使用低分辨率的ZeroScope模型(576或448)。
图片
需要在执行更高分辨率模型(如Potat 1或ZeroScope XL)时,权衡执行时间会更长。
再次等待复选标记出现,继续执行下一步。
选择在Step2中安装并希望使用的模型型号,对于更高分辨率的模型,推荐下面的配置参数,不需要太长的生成时间。
图片
接下来,您可以输入目标视频的提示词来改变效果,并且还可以输入否定提示词(negative prompts),然后点击运行按钮。
等待一会后,生成的视频就会被放置在outputs目录下。
图片
目前来说,文生视频领域仍处于起步阶段,即便是最好的工具也只能生成几秒钟的视频,并且通常存在较大的视觉缺陷。
但其实文生图模型最初也面临着类似的问题,但仅仅几个月后就实现了照片级真实感。
不过与文生图模型不同的是,视频领域在训练和生成期间所需要的资源都要更比图像更多。
虽然谷歌已经研发出了Phenaki和Imagen Video模型,可以生成高分辨率、更长、逻辑连贯的视频片段,但公众无法使用到这两个模型;Meta的Make-a-Video模型也同样没有发布。
目前可用的工具仍然只有Runway的商用模型Gen-2,此次Zeroscope的发布也标志着文生视频领域第一个高质量开源模型的出现。
以上就是AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑的详细内容,更多请关注其它相关文章!
# 开源
# 目录下
# 谁能
# 更高
# 只需
# 还可以
# 首个
# 显存
# phenaki
# stable diffusion
# runway
# ai
# 高质量
# 天津优化网站哪个好
# seo专员职位职责
# 邯郸天猫网站推广介绍
# 营销推广怎么注册营业执照
# 巩义网站建设与推广方案
# 通州区网站建设好处
# 初级seo工程师
# 福州市网站推广服务外包
# seo精准营销分类
# 餐饮网站如何优化
# 上海
相关栏目:
【
行业新闻62819 】
【
科技资讯67470 】
相关推荐:
聚焦人工智能大模型、AIGC 徐汇十余场重磅论坛等你来
尼康尼克尔 Z 180-600mm f/5.6-6.3 VR 镜头发布,12499 元
外科医生的智能助手,“机器人手术”得到补充商业医保覆盖
无需标注数据,「3D理解」进入多模态预训练时代!ULIP系列全面开源,刷新SOTA
AI创作广告文案等同2.47年工作经验,且消费者无法区分|AI营销前沿
以计算机视觉技术为基础的库存管理如何改革零售行业
将上下文长度扩展到256k,无限上下文版本的LongLLaMA来了?
英国前首相:AI可能被用来制造“生物恐怖武器”
天翼云在国际AI顶会大模型挑战赛中获得冠军
人工智能大胆预测:银河系至少有2万个地球,36种外星文明
当一个网站的内容被 AI 完全接管
2025年贵州省青少年机器人竞赛在安举行
ChatGPT大更新!OpenAI奉上程序员大礼包:API新增杀手级能力还降价,新模型、四倍上下文都来了
智能化解决方案:保障数据安全阻击泄露和丢失
改动一行代码,PyTorch训练三倍提速,这些「高级技术」是关键
业内领先 四川大学华西第四医院甲状腺乳腺外科成功进入手术机器人时代
谷歌推出RT-2视觉语言动作模型,使机器人能够掌握垃圾丢弃技能
Zoom远程会议应用:AI培训需经用户授权
导演郭帆:人工智能应用可能会影响《流浪地球 3》的创作开发
有 ARM 和 X86 两个版本,香橙派游戏掌机细节曝光
人工智能颠覆软件测试四大方式
“可用”“有用”的讯飞星火认知大模型将亮相世界人工智能大会
数字彩排、虚拟建厂!这家顶级洗衣机工厂敲开“工业元宇宙”之门
张朝阳陆川谈AI:大数据模型大幅提升工作效率,ChatGPT冲击最大的是内容创作领域
联想创投携手12家被投企业MWC展示元宇宙、机器人等技术
复盘MWC上海:AI大模型时代到来 通信网络将会怎样改变?
“图壤·阅读元宇宙”亮相北京国际图书博览会
AI和ML推动联网设备的增长
谷歌 Gmail“帮我写电子邮件”AI 功能开始向安卓和苹果设备推广
真全息产品,亮相深圳文博会——dipal数伴拓展元宇宙非沉浸式体验
探索人工智能和物联网的动态融合
人工智能在商业中的风险和局限性
无人机自主巡检为高海拔输电线路运维添“新彩”
警惕!AI或致虚假信息泛滥
AI 作画工具 Midjourney 推出“pan”功能,可平移扩展图片外场景
比尔盖茨:AI确实存在风险,但可控
不到2S创作AI图像!Snap发布图像生成器SnapFusion
以分布式网络串联闲置GPU,这家创企称可将AI模型训练成本降低90%
一图速览 | 十大脑机接口关键技术发布
利亚德加码AI战略,与光年无限图灵机器人全面开展AI研发业务合作
IBM和NASA合作发布可追踪碳排放的开源AI基础模型
学而思网校推出首个基于自研大模型的《人工智能第一课》
自研4D激光雷达L1 + GPT大语言模型 宇树Unitree Go2四足机器人有啥黑科技?
斑马推出全新升级版思维机:以人工智能为核心的交互式学习体验
上海发布大模型政策 打造AI“模”都
寻求能源转型最优解
MiracleVision视觉大模型
联合国秘书长称支持建立全球人工智能监管机构
上海发布“元宇宙关键技术攻关行动方案”,加快 AIGC 等突破
谷歌将使用公开信息训练 AI 模型,构建更强大的自家产品