AIBL论坛

 找回密码
 立即注册
本论坛所有软件旨在帮助用户创建逼真且有趣的内容,帮助做自媒体的人制作原创有趣的视频或广告,如果使用别人的肖像,使用之前需获得同意和许可(建议使用AI生成的人脸),严禁使用本论坛发布的资源用于不符合当地法律法规的事情,如发现用于不正规用途,一律删号处理
查看: 828|回复: 4

Ultralight-Digital-Human数字人整合包(需要训练模型)

[复制链接]
发表于 2024-12-3 12:08:54 | 显示全部楼层 |阅读模式
准备好你的视频,3到5分钟的就可以,必须保证视频中每一帧都有整张脸露出来的人物,声音清晰没有杂音,把它放到一个新的文件夹里面。
视频说话的质量决定训练后模型的质量,决定着数字人的质量, 视频质量一定要选择好的
使用建议: 自己或者公司员工录制3到5分钟口播绿幕视频,然后训练模型, 生成对口型视频, 再视频换背景, 使用rope视频换脸(嘴部区域不替换),基本可以达到商用数字人效果,不露脸也能做自媒体口播
此项目训练批次默认为200, 可以修改成600, 效果也许更好, 基本可以达到商用效果
对口型的音频文件采用 .wav 格式,采样率为 16kHz,单通道为 16 位。码率(比特率)推荐为256K,音频清晰无杂音

视频效果演示 :  https://pan.baidu.com/s/1Zy-mgqFwcjY4NVncZRIwYQ?pwd=j6qt
--来自百度网盘超级会员v5的分享
操作步骤请看: https://github.com/anliyuan/Ultralight-Digital-Human


7.jpg
整合包里边的bat 文件, 请根据操作修改 视频.音频,模型路径, 训练模型操作比较复杂
不适合新手, 需要训练模型, 每一步的bat 文件已经创建, 但是根据要求需要修改bat文件里边的音频,视频,模型路径, 可加QQ群交流

首先我们需要提取音频特征,我用了两个不同的特征提取起,分别是wenet和hubert,感谢他们。
如果你选择使用wenet的话,你必须保证你视频的帧率是20fps,如果选择hubert,视频帧率必须是25fps
实验中,hubert的效果更好,但是wenet速度更快,整合包使用的是hubert
需要显卡:英伟达8G
系统要求: win10  win11


整合包下载地址:
链接: https://pan.baidu.com/s/1ObAfIIJOHCH0YPGPw4wOqA?pwd=3e8w







AIBL论坛免责申明
本论坛刊载的所有内容,包括图片、软件、模型等均在网上搜集。
论坛提供的内容仅用于个人学习、研究或欣赏。我们不保证内容的正确性。通过使用本站内容随之而来的风险与本站无关
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏,以及其他非商业性或非盈利性用途,但同时应遵守著作权法及其他相关法律的规定,不得侵犯本网站及相关权利人的合法权利。
本网站内容原作者如不愿意在本网站刊登内容,请及时通知本站,予以删除。

0

主题

6

回帖

14

积分

初级丹童

积分
14
发表于 2024-12-3 22:26:48 | 显示全部楼层
一搜论坛果然有,万分感谢大佬分享
回复

使用道具 举报

0

主题

90

回帖

273

积分

高级丹童

积分
273
发表于 2024-12-13 11:17:37 | 显示全部楼层
报到拿灵石
回复

使用道具 举报

0

主题

8

回帖

33

积分

初级丹童

积分
33
发表于 5 天前 | 显示全部楼层
哇,楼主厉害,膜拜,下一个
回复

使用道具 举报

0

主题

19

回帖

20

积分

初级丹童

积分
20
发表于 4 天前 | 显示全部楼层
这个操作有点复杂,那种打开就可以直接用的才是大众的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|AIBL论坛

GMT+8, 2025-1-18 10:04 , Processed in 0.094369 second(s), 25 queries , Gzip On.

Powered by AI技术论坛 X3.5

© 2001-2023 dfl论坛

快速回复 返回顶部 返回列表