自媒体利器:阿里通义万象(Wan)(文生视频/图生视频)认知
99%的焦虑都来自于虚度时间和没有好好做事,所以唯一的解决办法就是行动起来,认真做完事情,战胜焦虑,战胜那些心里空荡荡的时刻,而不是选择逃避。不要站在原地想象困难,行动永远是改变现状的最佳方式
写在前面
- 博文内容为 阿里通义万象(Wan) 简单认知
- 理解不足小伙伴帮忙指正 :),生活加油
99%的焦虑都来自于虚度时间和没有好好做事,所以唯一的解决办法就是行动起来,认真做完事情,战胜焦虑,战胜那些心里空荡荡的时刻,而不是选择逃避。不要站在原地想象困难,行动永远是改变现状的最佳方式
持续分享技术干货,感兴趣小伙伴可以关注下 ^_^
Wan2.1 开源视频生成模型:让每个人都能轻松创作专业级视频
简单介绍
Wan2.1 是首个真正”亲民”的视频生成开源模型套件,具有以下突破性优势:
- 性能天花板:在多个评测基准测试中超越所有商业闭源视频模型
- 平民级硬件支持:1.3B模型仅需8GB显存即可运行,RTX 4090生成5秒480P视频仅需4分钟
- 全能创作能力:支持文本生成视频、图像扩展视频、视频编辑、文本生成图像等多种功能
- 多语言支持:全球首款中英双语视频生成模型
- 黑科技VAE:Wan-VAE视频编解码器可处理任意长度1080P视频,压缩效率提升300%
官网地址: https://wanxai.com/?utm_source=ai-bot.cn
项目地址: https://github.com/Wan-Video
在线体验地址:https://tongyi.aliyun.com/wanxiang/videoCreation
图生视频
生成视频
本地部署
Github 上面的部署教程很简单,就两条命了,在 window 上面试了好久没有成功,WSL 试了也不太行,主要问题是FLASH_ATTN
的安装,build 的时候一只卡着,没动静了。issues 上面也有好多其他的坑,所以不太建议没经验的小伙伴尝试,可以直接用在线版本的。之后 issues 解决可以尝试
1 | # 克隆代码库(首次访问可能需要科学上网) |
模型下载
模型类型 | 分辨率 | 下载地址(HuggingFace) | 下载链接(ModelScope) |
---|---|---|---|
T2V-14B | 480P/720P | HuggingFace | ModelScope |
I2V-14B-720P | 720P | HuggingFace | ModelScope |
T2V-1.3B | 480P | HuggingFace | ModelScope |
性能实测
下面为 readme 文件中提供的性能测试,有实际需求的小伙伴可以参考
不同硬件生成速度对比
模型 | GPU型号 | 分辨率 | 生成时长 | 显存峰值 |
---|---|---|---|---|
T2V-14B | RTX 4090 | 720P | 120秒 | 16GB |
I2V-14B | A100×8 | 720P | 60秒 | 32GB |
T2V-1.3B | RTX 4080 | 480P | 4分钟 | 8GB |
博文部分内容参考
© 文中涉及参考链接内容版权归原作者所有,如有侵权请告知 :)
© 2018-至今 liruilonger@gmail.com, 保持署名-非商用-相同方式共享(CC BY-NC-SA 4.0)
自媒体利器:阿里通义万象(Wan)(文生视频/图生视频)认知
https://liruilongs.github.io/2025/02/26/待发布/自媒体利器-阿里通义万象-Wan-文生视频-图生视频-认知/