AI柠檬

admin 提交于 周六, 05/07/2022 - 08:50

https://blog.ailemon.net/

 

ASRT训练环境配置备忘:

  • pip install -r requirements.txt 有报错似乎也没有关系
  • 数据库国内网址无法访问,需访问国外网址。
  • 下载后需配置asrt_config.json,把没有下载的训练数据库去掉
  • 不够内存的话运行python3 train_speech_model.py会崩溃
  • 设置pip国内源

$ py -m pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/
Writing to C:\Users\dell\AppData\Roaming\pip\pip.ini

  • 在未配置GPU的情况下,训练THCHS30数据集大概需要用2小时40分(要做50个epoch)。CPU主频3GHz,8核,CPU占用近100%,内存占用峰值近10G。机器其它程序可以正常使用(没有感觉CPU100%)
  • 下载安装CUDA:https://developer.nvidia.com/cuda-downloads ,安装包有2.5G,安装失败,报错An unknown error has occured. 把版本降到11.5后可以安装:https://developer.nvidia.com/cuda-11-5-2-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exe_network
  • 每训练(train_speech_model.py)完一个epoch似乎是会保存的,可以修改代码,从某一个epoch开始。也可以指定初始的数据(似乎是可以继承其它数据集的训练结果)
  • 做了6个epoch后测试(evaluate_speech_model.py),结果返回*[ASRT Test Result] Speech Recognition dev set word error ratio:  100.0 %,对于输入的123.wav,一个字也识别不出来。用发行版v1.2的save_models取代自己训练的save_models,结果为*[ASRT Test Result] Speech Recognition dev set word error ratio:  17.09741550695825 %。
  • 下一步,一边继续慢慢CPU训练数据。一边了解迭代epoch做的事,和model提取的特征是什么。
  • 做了19个epoch后测试, error ratio:  99.99657229039556 %

 

标签

添加新评论

Restricted HTML

  • 允许的HTML标签:<a href hreflang> <em> <strong> <cite> <blockquote cite> <code> <ul type> <ol start type> <li> <dl> <dt> <dd> <h2 id> <h3 id> <h4 id> <h5 id> <h6 id> <img src>
  • 自动断行和分段。
  • 网页和电子邮件地址自动转换为链接。
验证码
This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.
请输入"汉语"