meiyouruguo 发表于 2024-6-19 14:38:36

hallo数字人对口型工具解压即用本地整合包

刚开源,英文效果挺好的,牙齿比较清晰
目前不支持中文,最慢的一款对口型工具, 等待后期更新
本人4070的12G显存,生成一个11秒的音频花费了3个小时, 推荐16G显存以上使用此整合包,低于16G的不建议下载(鸡肋一样的项目)


源图像:
必须被裁剪成正方形。
脸部应该是主要焦点,占图像的 50%-70%。
面应朝前,旋转角度小于 30°(无侧面轮廓)。
音频:
必须是 WAV 格式。
必须是英文的,因为我们的训练数据集只有这种语言。
确保人声清晰;背景音乐是可以接受的。
运行推理:
python scripts/inference.py --source_image examples/reference_images/1.jpg --driving_audio examples/driving_audios/1.wav
更多选项:
usage: inference.py [-h] [-c CONFIG] [--source_image SOURCE_IMAGE] [--driving_audio DRIVING_AUDIO] [--output OUTPUT] [--pose_weight POSE_WEIGHT]
                  [--face_weight FACE_WEIGHT] [--lip_weight LIP_WEIGHT] [--face_expand_ratio FACE_EXPAND_RATIO]

options:
-h, --help            show this help message and exit
-c CONFIG, --config CONFIG
--source_image SOURCE_IMAGE
                        source image
--driving_audio DRIVING_AUDIO
                        driving audio
--output OUTPUT       output video file name
--pose_weight POSE_WEIGHT
                        weight of pose
--face_weight FACE_WEIGHT
                        weight of face
--lip_weight LIP_WEIGHT
                        weight of lip
--face_expand_ratio FACE_EXPAND_RATIO
                        face region
hallo数字人整合包下载地址:

https://pan.baidu.com/s/16yBVuWTOU4kCvjv1te2C6Q?pwd=bult
解压密码:www.aibl.vip




cw123en 发表于 2024-6-19 16:53:56

多谢分享,下载收藏

betterwxf 发表于 2024-6-19 17:14:55

不错,想试试

orz2024 发表于 2024-6-19 18:33:25

感谢分享

rileysum 发表于 2024-6-19 19:30:22

多谢分享,下载收藏

w4l6 发表于 2024-6-19 20:24:58

多谢分享,下载收藏

906096131 发表于 2024-6-19 23:43:30

感谢大佬分享

bear2099 发表于 2024-6-20 07:29:23

太棒了,又有新项目

wukw 发表于 2024-6-20 09:51:08

感谢分享

luorei2016 发表于 2024-6-20 10:14:40

多谢分享,下载收藏
页: [1] 2 3 4 5 6 7 8
查看完整版本: hallo数字人对口型工具解压即用本地整合包