By admin , 21 五月, 2025

https://github.com/hexgrad/kokoro

Kokoro is an open-weight TTS model with 82 million parameters. Despite its lightweight architecture, it delivers comparable quality to larger models while being significantly faster and more cost-efficient. With Apache-licensed weights, Kokoro can be deployed anywhere from production environments to personal projects.

支持普通话,合成8个字2.5秒的短句耗时0.7秒。这个模型似乎真的是很快!

来自AI的比较:

标签

By admin , 20 五月, 2025

梅尔频谱参数

  • num_mels: 80
    梅尔滤波器组的数量,决定了梅尔频谱的维度。80 是 Tacotron2 的标准配置。
  • mel_fmin: 50.0, mel_fmax: 7600.0
    梅尔频谱的最低和最高频率(Hz)。对于粤语,这些值覆盖了大部分语音的频率范围(粤语的声调变化可能需要较高的上限)。

标签

By admin , 20 五月, 2025
trim_db: 60 裁剪静音的阈值(dB),低于此阈值的音频会被视为静音。

标签

By admin , 20 五月, 2025

2025-5-20

接着这个页面的开发:https://cto.eguidedog.net/node/1391

测试checkpoint 150K生成音频失败,可能是应该从头训练,先把训练停了,把所有参数细节研究一下再重新开始。

检查参数发现sample_rate错了,应该从22050改为16000。

根据AI建议,把mel_fmax从7600改为8500,以适应粤语的声调变化。

根据AI建议,把norm_schedule改为了true,自适应学习率调度,初始阶段升温,之后衰减。

有一些问题待调研:

标签

By admin , 27 四月, 2025

到社区版首页->快速上首->使用All in One安装包安装:

bash -c "$(curl -s https://obbusiness-private.oss-cn-shanghai.aliyuncs.com/download-center/opensource/oceanbase-all-in-one/installer.sh)"
source ~/.oceanbase-all-in-one/bin/env.sh
obd demo

启动后到配置文件查看oceanbase-ce的root_password密码:

~/.obd/cluster/demo

然后连接数据库:

By admin , 14 四月, 2025

2025年4月中美贸易战白热化,美国率先把关税提高到超过100%,意味着两国大部分贸易将无法正常进行。我们回顾一下2024年中国的进出口数据,发现美国占中国的出口额不到15%,并非一个很致命的比例,折算成GDP是2.8%。就是说中美贸易贸易战对中国GDP会拖累2.8%左右。这里当然没有把骨牌效应计算在内,并且对相关行业的从业者来说可能是致命的打击。

最新评论