hallo数字人对口型工具解压即用本地整合包

meiyouruguo 发表于 2024-6-19 14:38:36

刚开源,英文效果挺好的,牙齿比较清晰
目前不支持中文,最慢的一款对口型工具, 等待后期更新
本人4070的12G显存,生成一个11秒的音频花费了3个小时, 推荐16G显存以上使用此整合包,低于16G的不建议下载（鸡肋一样的项目）

源图像：
必须被裁剪成正方形。
脸部应该是主要焦点，占图像的 50%-70%。
面应朝前，旋转角度小于 30°（无侧面轮廓）。
音频：
必须是 WAV 格式。
必须是英文的，因为我们的训练数据集只有这种语言。
确保人声清晰;背景音乐是可以接受的。
运行推理:
python scripts/inference.py --source_image examples/reference_images/1.jpg --driving_audio examples/driving_audios/1.wav
更多选项：
usage: inference.py [-h] [-c CONFIG] [--source_image SOURCE_IMAGE] [--driving_audio DRIVING_AUDIO] [--output OUTPUT] [--pose_weight POSE_WEIGHT]
               [--face_weight FACE_WEIGHT] [--lip_weight LIP_WEIGHT] [--face_expand_ratio FACE_EXPAND_RATIO]

options:
-h, --help          show this help message and exit
-c CONFIG, --config CONFIG
--source_image SOURCE_IMAGE
                     source image
--driving_audio DRIVING_AUDIO
                     driving audio
--output OUTPUT    output video file name
--pose_weight POSE_WEIGHT
                     weight of pose
--face_weight FACE_WEIGHT
                     weight of face
--lip_weight LIP_WEIGHT
                     weight of lip
--face_expand_ratio FACE_EXPAND_RATIO
                     face region
hallo数字人整合包下载地址:

https://pan.baidu.com/s/16yBVuWTOU4kCvjv1te2C6Q?pwd=bult
解压密码:www.aibl.vip

cw123en 发表于 2024-6-19 16:53:56

多谢分享，下载收藏

betterwxf 发表于 2024-6-19 17:14:55

不错，想试试

orz2024 发表于 2024-6-19 18:33:25

感谢分享

rileysum 发表于 2024-6-19 19:30:22

多谢分享，下载收藏

w4l6 发表于 2024-6-19 20:24:58

多谢分享，下载收藏

906096131 发表于 2024-6-19 23:43:30

感谢大佬分享

bear2099 发表于 2024-6-20 07:29:23

太棒了，又有新项目

wukw 发表于 2024-6-20 09:51:08

感谢分享

luorei2016 发表于 2024-6-20 10:14:40

多谢分享，下载收藏

页: [1] 2 3 4 5 6 7 8

AIBL论坛's Archiver

hallo数字人对口型工具解压即用本地整合包