https://github.com/OHF-Voice/piper1-gpl
A fast, local neural text to speech system that sounds great and is optimized for the Raspberry Pi 4. Piper is used in a variety of projects.
支持中文,huayan停顿的位置不太对。xiao_ya的效果比较理想,下面可以听demo:
https://rhasspy.github.io/piper-samples/
编程接口:https://github.com/OHF-Voice/piper1-gpl/tree/main/libpiper
C/C++编程接口似乎是不支持中文的,因为中文有一个特殊的phonemizer,要按拼音方式处理,而不是espeak的phonemizer。这个库似乎依赖于Python。因此,中文的话,需要通过http_server方式调用。
安装依赖g2pw,但是在piper:__main__.py里"voice.synthesize(line, syn_config)"没有提供download_dir参数,因此只能取默认当前目录。当前目录如果没有下载过g2pw模型就会下载一个153M的模型文件。并且是连接huggingface下载,网络很可能是不通的。即使下载了g2pw,File "/opt/miniconda3/lib/python3.12/site-packages/g2pw/api.py", line 79还是会尝试连接huggingface找一下有没有增补字库。需要打补丁才能用。
评论