声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权站长之家转载发布。
【新智元导读】首个高质量文本转视频开源模型Zeroscope,仅需8G显存就能用!
文生图模型Stable Diffusion开源后,将「AI艺术」彻底平民化,只需一张消费级显卡即可制作出非常精美的图片。
【资料图】
而文本转视频领域,目前质量较高的只有Runway前不久推出的商用Gen-2模型,开源界还没有一个能打的模型。
最近,Huggingface上有作者发布了一个文生视频模型Zeroscope_v2,基于17亿参数量的ModelScope-text-to-video-synthesis模型进行二次开发。
模型链接:https://huggingface.co/cerspense/zeroscope_v2_576w
相比于原版本,Zeroscope生成的视频没有水印,并且流畅度和分辨率都得到了提升,适配16:9的宽高比。
开发者cerspense表示,他的目标就是和Gen-2进行开源较量,即提高模型质量的同时,还能免费供大众使用。
Zeroscope_v2包括两个版本,其中Zeroscope_v2567w可以快速生成576x320像素分辨率、帧率为30帧/秒的视频,可用于视频概念的快速验证,只需要约7.9GB的显存即可运行。
Zeroscope_v2XL可以生成1024x576分辨率的高清视频,大约需要15.3GB的显存。
Zeroscope还可以与音乐生成工具MusicGen一起使用,快速制作一个纯原创短视频。
Zeroscope模型的训练用到了9923个视频片段(clip)以及29769个标注帧,每个片段包括24帧。偏移噪声包括视频帧内对象的随机移位、帧定时(frame timings)的轻微变化或微小失真。
训练期间引入噪声可以增强模型对数据分布的理解,从而可以生成更多样化的逼真视频,并更有效地解释文本描述中的变化。
使用方法
使用stable diffusion webui
在Huggingface上下载zs2_XL目录下的权重文件,然后放到stable-diffusion-webui\models\ModelScope\t2v目录下即可。
在生成视频时,推荐的降噪强度值为0.66到0.85
使用Colab
笔记链接:https://colab.research.google.com/drive/1TsZmatSu1-1lNBeOqz3_9Zq5P2c0xTTq?usp=sharing
先点击Step1下的运行按钮,等待安装,大约需要3分钟;
当按钮旁边出现绿色复选标记时,继续执行下一步。
点击想要安装模型附近的运行按钮,为了能够在Colab中快速获得3秒左右的剪辑视频,更推荐使用低分辨率的ZeroScope模型(576或448)。
如果相运行更高分辨率模型(Potat1或ZeroScope XL),运行也会更费时间,需要做出权衡。
再次等待复选标记出现,继续执行下一步。
选择在Step2中安装并希望使用的模型型号,对于更高分辨率的模型,推荐下面的配置参数,不需要太长的生成时间。
然后为目标视频效果输入提示词,也可以输入否定提示(negative prompts),再按下运行按钮。
等待一会后,生成的视频就会被放置在outputs目录下。
extremely detailed, Futuristic Cityscape, blade runner, extremely cloudy, awardwinning, best quality,8k
非常详细,未来城市景观,叶片亚军,极端多云,获奖,最好的质量,8k
「文生视频」开源竞赛
目前来说,文生视频领域仍处于起步阶段,即便是最好的工具也只能生成几秒钟的视频,并且通常存在较大的视觉缺陷。
但其实文生图模型最初也面临着类似的问题,但仅仅几个月后就实现了照片级真实感。
不过与文生图模型不同的是,视频领域在训练和生成期间所需要的资源都要更比图像更多。
虽然谷歌已经研发出了Phenaki和Imagen Video模型,可以生成高分辨率、更长、逻辑连贯的视频片段,但公众无法使用到这两个模型;Meta的Make-a-Video模型也同样没有发布。
目前可用的工具仍然只有Runway的商用模型Gen-2,此次Zeroscope的发布也标志着文生视频领域第一个高质量开源模型的出现。
参考资料:
https://the-decoder.com/zeroscope-is-a-free-text-to-video-model-that-runs-on-modern-graphics-cards/
(举报)
-
AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G显存可跑 全球热讯AI新风口?首个高质量「文生视频」模型Zeroscope引发开源大战:最低8G -
今日快讯:7月5日山东地区烧碱价格弱势运行7月5日山东地区烧碱价格弱势运行,32%离子膜碱主流市场报价710-800元 -
头条:前有大s添堵,后有老妈捣乱!汪小菲想接回孩子,难度太大剩兴而去,败兴而归!真难为汪小菲了,这次台湾之行,本想去接两个孩子 -
冗长的“家长会”也是一种教育焦虑近日,有网友爆料称孩子即将上小学,却在开学前收到学校通知,需要全程 -
东寨镇:网格管理“六大员” 善治乡村促振兴-环球短讯今年以来,永昌县东寨镇以“任务网格化、管理精细化、服务亲情化、机制 -
陈治良今年多少岁(陈治良) 世界时快讯来为大家解答以上的问题。陈治良今年多少岁,陈治良这个很多人还不知道 -
全球关注:今年就能交付!方程豹汽车首款车型定名豹5,售价或超40万日前,我们从方程豹汽车获悉,方程豹首款车型命名为“豹5”,将搭载云 -
研究人员在三江源地区发现古岩溶地貌研究人员在三江源地区发现古岩溶地貌---近日,青海极地自然资源调查研 -
口腔炎喷雾剂说明书来为大家解答以上的问题。口腔炎喷雾剂说明书这个很多人还不知道,现在 -
父亲节手工折纸小学生(父亲节手工折纸)你们好,最近小活发现有诸多的对于父亲节手工折纸小学生,父亲节手工折 -
人鱼公主的故事图片_人鱼公主的故事hello大家好,我是价值网小科来为大家解答以上问题,人鱼公主的故事图 -
无线传感器网络基础:理论和实践_关于无线传感器网络基础:理论和实践介绍1、《无线传感器网络基础:理论和实践》是2013年清华大学出版社出版的 -
联通话费充q币充值平台_联通话费充q币1、在腾讯官网上充值登录QQ,然后在“所有服务”里找到“QQ充值”,点 -
世界快讯:祁连山:7月4日融券卖出6.71万股,融资融券余额7.13亿元7月4日,祁连山(600720)融资买入1300 9万元,融资偿还1707 62万元, -
全球今热点:银河退7月5日快速反弹以下是银河退在北京时间7月5日10:00分盘口异动快照:7月5日,银河退盘 -
2022“奔跑吧·少年”主会场活动在湖北启动据悉,“奔跑吧·少年”儿童青少年主题健身活动于2021年发起开展。 -
未来三年 创建100个文创产业示范基地|世界热闻未来三年创建100个文创产业示范基地,主流媒体,山西门户。山西新闻网是 -
今日最新!山东:做好“去、提、增”三篇文章 实现工业运行“开门红”近日,《山东省深入打好重污染天气消除、臭氧污染防治和柴油货车污染治 -
从“心”启航 向阳而生沙盘游戏、听音乐、借阅心理书籍……走进安徽省滁州市未成年人心理健康 -
团省委来黄龙县调研夏令营和科普研学工作|当前独家7月3日至4日,团省委青少年活动交流与服务中心主任、省青少年宫协会副 -
请假情况说明申请范文标准模板请假情况说明申请范文标准模板(精选3篇)请假情况说明申请范文标准模 -
桃花源记2赚钱攻略(桃花源记2礼包)-每日观察1、360卫士领完点击左上角福字再点360卫士礼包360卫士领完找特权使者。 -
天天热议:安杰思(688581)7月4日主力资金净卖出2394.46万元截至2023年7月4日收盘,安杰思(688581)报收于128 78元,上涨3 76%,换 -
“二手车隐贵”汽车街的喜与忧 快资讯“二手车隐贵”汽车街的喜与忧,电商,优信,4s店,汽车街,二手车交易 -
兰州公安发布警情预警谨防高校招生录取骗局2023年普通高校招生录取工作已经开始,一些不法分子利用考生和家长的急 -
78家公司上半年业绩预喜|当前简讯Wind数据显示,截至7月4日20时,A股共有96家上市公司披露了2023年半年 -
世界关注:肖战、任敏《玉骨遥》开播:追剧日历公布今(2)日,电视剧《玉骨遥》官宣今晚18点开播,直冲热搜第一。该剧根 -
手机相关知识:苹果11摄像机闪光灯怎么开科技、数码、互联网新闻如今都成为了大众所关注的热点了,因为在我们的 -
焦点精选!万里印刷(08385)拟溢价约22.22%配股 最高净筹约1161万港元智通财经APP讯,万里印刷(08385)发布公告,于2023年7月4日,公司拟配售 -
虚假大学野鸡大学招生骗局何以屡禁不止?该如何治理? 微头条只要花2万,百分之百上目标学校?虚假大学野鸡大学招生骗局调查□
