By admin , 20 五月, 2025 梅尔频谱参数研究 梅尔频谱参数num_mels: 80梅尔滤波器组的数量,决定了梅尔频谱的维度。80 是 Tacotron2 的标准配置。mel_fmin: 50.0, mel_fmax: 7600.0梅尔频谱的最低和最高频率(Hz)。对于粤语,这些值覆盖了大部分语音的频率范围(粤语的声调变化可能需要较高的上限)。 标签 TTS
By admin , 20 五月, 2025 Coqui Cantonese xTTS v2 training 2025-5-20接着这个页面的开发:https://cto.eguidedog.net/node/1391测试checkpoint 150K生成音频失败,可能是应该从头训练,先把训练停了,把所有参数细节研究一下再重新开始。检查参数发现sample_rate错了,应该从22050改为16000。根据AI建议,把mel_fmax从7600改为8500,以适应粤语的声调变化。根据AI建议,把norm_schedule改为了true,自适应学习率调度,初始阶段升温,之后衰减。有一些问题待调研: 标签 TTS
By admin , 8 五月, 2025 A generative speech model for daily dialogue. - ChatTTS https://github.com/2noise/ChatTTS可以运行,不要安装vllm可选模块,否则webui.py无法运行(依赖不满足)。开源模型的效果一般般,CPU推理一句话需要半分钟到1分钟。 标签 TTS
By admin , 30 四月, 2025 文件Web预览器kkFileView https://github.com/kekingcn/kkFileView项目没有提供jar包,需要到一个收费的社区里下载,但可以自己编译:https://kkview.cn/zh-cn/docs/build.html编译大概耗时40分钟,编译好后把server/target/kkFileView-4.4.0.jar复制到server/src/main/bin。做些配置:server/src/main/config/application.properties
By admin , 27 四月, 2025 OceanBase使用指南 到社区版首页->快速上首->使用All in One安装包安装:bash -c "$(curl -s https://obbusiness-private.oss-cn-shanghai.aliyuncs.com/download-center/opensource/oceanbase-all-in-one/installer.sh)" source ~/.oceanbase-all-in-one/bin/env.sh obd demo启动后到配置文件查看oceanbase-ce的root_password密码:~/.obd/cluster/demo然后连接数据库:
By admin , 14 四月, 2025 2024年进出口数据 2025年4月中美贸易战白热化,美国率先把关税提高到超过100%,意味着两国大部分贸易将无法正常进行。我们回顾一下2024年中国的进出口数据,发现美国占中国的出口额不到15%,并非一个很致命的比例,折算成GDP是2.8%。就是说中美贸易贸易战对中国GDP会拖累2.8%左右。这里当然没有把骨牌效应计算在内,并且对相关行业的从业者来说可能是致命的打击。 标签 中国知识线
By admin , 9 四月, 2025 2025年各国政府债务占GDP比例 和2022年比,美国从137下降到122,中国从66.8上升到83.4。委内瑞拉从350降到146。新加坡从131升到171。 标签 世界知识线
By admin , 9 四月, 2025 2025年世界各国GDP/PPP排名 和2021年相比,美国GDP占比上升,中国明显下降,转变了之前的趋势。但美国的PPP占比有所下降,而中国基本维持。 标签 世界知识线
最新评论