eGuideDog Linux 26开发日志

By admin , 26 三月, 2026

2026-3-26

Mate桌面由于欠维护，已从LTS版本中移除。因此，eGuideDog Linux 26将选择官方默认的Gnome作为开发基础。

Daily Build下载地址：https://cdimages.ubuntu.com/daily-live/current/

安装指南：https://cto.eguidedog.net/node/1456

2026-3-27

speech-dispatch已经更新到0.12，原来Ekho使用的版本是0.11，虽然经修复后可以使用，但还是考虑合并最新代码（@todo 1，已完成）。

piper依赖torch，安装依赖很多也很大，暂时因为以下错误失败：“RROR: Could not install packages due to an OSError: [Errno 122] 超出磁盘配额”

不知道为什么，考虑重新安装虚拟机，分配多一些磁盘空间（事实上目前还有10G剩余的）。

2026-3-30

本来想通过apt安装pytorch的，发现torch不在apt包里。

已把上游最新代码合并到speechd，过程顺利：

$ git remote add upstream https://github.com/brailcom/speechd.git
$ git fetch upstream
$ git merge upstream/master
修复冲突
$ git commit -a -m 'merge from upstream'
$ git push origin master // orgin master可不要

speechd和ibusreader在Ubuntu 24.04下也不能正常使用，先在24下调试通过再解决26的问题。

在AI帮助下修复了一个speechd的崩溃问题。

dog restart后似乎不能正常启用orca，有时要再按SUPER+ALT+s

ibusreader不能正常使用。调试ibus步骤如下：

1. export G_MESSAGES_DEBUG=all
2. 把系统的/usr/bin/ibus-daemon改名，让其不自动执行重启
3. kill 然后重启进程/usr/lib/ibus/ibus-engine-libpinyin --ibus
4. 此后，屏幕上就能看到g_message的消息了

可以看到ibusreader已经调用了spd_speak了，但没有声音。如果把屏幕阅读器关闭了，则ibusreader反而有声音，后来不知道怎么开关orca之后ibusreader就能读出来的。看起来问题是对当前开关状态的检测。

Ubuntu旧版的ibus-reader基于ibus-libpinyin-1.12.4，debian则基于1.15.2，ibus-libpinyin最新版本为1.16.5。先升级到最新版再调试：

$ git remote add upstream https://github.com/libpinyin/ibus-libpinyin.git
$ git fetch upstream
$ git merge upstream/main
修复冲突
$ git commit -a -m 'merge from upstream'
$ git push

升级后无法安装，报如下错误，这可能是当初Ubuntu保留旧版的原因：

Package dependency requirement 'libpinyin >= 2.9.92' could not be satisfied.
Package 'libpinyin' has version '2.8.1', required version is '>= 2.9.92'

Ubuntu 26.04的libpinyin是最新stable版的2.10.3。因此，我们在Ubuntu 24.04里也尝试从源代码安装最新版的libpinyin(2.11.91)。最新版ibusreader在Ubuntu 24.04下使用正常，已更新dog并发布。

下一步是在Ubuntu 26.04下调试Ekho、speech-dispatcher、ibusreader、piper。

2026-3-31

在Ubuntu 26.04上安裝了最新版ibusreader（修復了一個依賴問題），但没有声音。可能应该先让Ekho、speech-dispatcher正常工作。发现新版ibusreader可以切换简繁体，挺方便的。

2026-4-1

新版Ekho在speech-dispatcher上安装后无法启动Ekho，sd_ekho进程存在几秒后就变成了sd_espeak_ng。如果手动启动sd_ekho，会有如下情况：

$ /usr/libexec/speech-dispatcher-modules/sd_ekho /home/hgneng/.config/speech-dispatcher/modules/ekho.conf
Wed Apr  1 15:11:14 2026 [169841]: Configuration (pre) has been read from "/home/hgneng/.config/speech-dispatcher/modules/ekho.conf"

ERROR: Server did not start with INIT
Wed Apr  1 15:11:17 2026 [850126]: module_close
Wed Apr  1 15:11:17 2026 [850153]: speak_queue Joining play thread.
段错误                  （核心已转储） /usr/libexec/speech-dispatcher-modules/sd_ekho /home/hgneng/.config/speech-dispatcher/modules/ekho.conf

如果在Ubuntu24则没有段错误。很神奇的是，竟然变成了一个可与用户交互的程序，可以在屏幕输入INIT，结果如下：

$ /usr/libexec/speech-dispatcher-modules/sd_ekho /home/hgneng/.config/speech-dispatcher/modules/ekho.conf
Wed Apr  1 15:30:55 2026 [986560]: Configuration (pre) has been read from "/home/hgneng/.config/speech-dispatcher/modules/ekho.conf"
INIT
Wed Apr  1 15:31:28 2026 [70628]: module_init begin
current dir: /home/hgneng/ekho-11.0
EKHO_DATA_PATH: /usr/local/share/ekho-data
EkhoImpl::init
getPcmFromPiperServer: path=/tmp/ekho1.wav
Fail to open /tmp/ekho1.wav
getPcmFromPiperServer: readPcmFromAudioFile size=0
Wed Apr  1 15:31:28 2026 [103436]: speak_queue Creating new thread for stop or pause.
Wed Apr  1 15:31:28 2026 [103634]: speak_queue Creating new thread for playback.
Wed Apr  1 15:31:28 2026 [103737]: module_init end
299-ekho initialized successfully.
299 OK LOADED SUCCESSFULLY
Wed Apr  1 15:31:28 2026 [103785]: speak_queue Playback thread starting.......
Wed Apr  1 15:31:28 2026 [103806]: speak_queue Stop or pause thread starting.......

尝试配置/etc/speech-dispatcher/speech.conf打开日至，但是/var/log/speech-dispatcher/里一直是空的。同样的配置方法在Ubuntu24里是可以产生日至的。

经调查，Ubuntu26开始/var/log有更严格的权限，进程权限更严格，要对log、speech-dispatcher都添加足够的权限才能写入。日至默认写到/run/user/1000/speech-dispatcher/log，可以认为这把用户的日至分隔开来，更安全。

如果暂时禁用enablePiper()，则sd_ekho不会被杀掉。从speech-dispatcher的日至看，似乎是enablePiper尝试连接没有启动的piper进程时返回了一些异常信息扰乱了和speech-dispatcher的交互协议。之后，重新在orca -s里设置ekho为默认语音就可以了。ibusreader也正常工作了。

修复语音后dog restart重启speech-dispatcher。然后运行spd-say 123确认语音配置正确。

下一步下载beta版，调试piper。部分beta已经提供下载，但AMD芯片的桌面版好像还没有提供：https://cdimages.ubuntu.com/releases/26.04/beta/

搜了一下，发现AMD的版本在一个更正式的页面里提供下载：https://releases.ubuntu.com/26.04/

2026-4-2

从清华的镜像下载更快：https://mirrors.tuna.tsinghua.edu.cn/ubuntu-releases/26.04/

可惜beta版安装失败了。明天再试试新的daily build版本。

2026-4-3

新的daily build已安装成功。由于忘记保存，开发日至丢失了。之前应该是做到成功安装了PyTorch（原因应该是/tmp挂在到了比较小的内存空间，不够用）。

2026-4-7

speech-api在Ubuntu26上文档模块出现编译错误，待解决。

已在代码上实现使用piper朗读英语，待测试。

2026-4-8

已解决Ekho在Ubuntu26上的安装问题，通过piper读英语也通过测试了。piper需要的内存比较多，在主机上看到占用超过1G物理内存和6.5G虚拟内存（并非swap），但因为主机共16G内存，响应很及时。在4G内存的虚拟机上感受到明显的延迟。迟些试试分配6G内存给虚拟机。

Ubuntu26上Orca的语音设置没有Ekho可选，一直都是espeak的声音。sd_ekho启动几秒后会被替换成espeak，待调查。

Ubuntu 4月16日会有candidate版发布，4月23日会发布正式版。

2026-4-9

感谢“蓦然回首”反馈实时天气问题。更新了天气软件接口，发布3.0版本。

更新了Ekho 26个字母的音频文件，修复了采样率不一致的问题。

在Ubuntu26里，spd-conf的设置似乎不生效（Ubuntu24上spd-conf不能运行），spd-say一直调用espeak的声音。

虚拟机内，piper的响应有点慢，似乎是CUP问题，而不是内存问题，可能没有办法解决。

明天继续调查Ubuntu26里speech-dispatcher无法调用Ekho的问题。

2026-4-10

piper中文占用物理内存约1G，是英文的10倍左右。合成速度也要慢10倍左右。在虚拟机里，合成一个简单的中文字词大概3秒起，速度难以接受。如果不是虚拟机则问题不大。尝试调试虚拟机硬件加速等参数，没有效果。

尝试装zhtts，但失败了。tensorflow装不上（Python 3.14还不支持这个包），尝试通过conda使用Python 3.12安装。

2026-4-13

zhtts在Ubuntu 26.04上运行报错，据说是因为glibc版本太新导致，但没有解决方案：

INFO: Created TensorFlow Lite XNNPACK delegate for CPU.
Traceback (most recent call last):
  File "/home/hgneng/zhtts/./zhttsServer.py", line 36, in <module>
    float32Data = tts.synthesis(content)
                  ^^^^^^^^^^^^^^^^^^^^^^
  File "/home/hgneng/zhtts/zhtts/tts.py", line 100, in synthesis
    mel = self.text2mel(text)
          ^^^^^^^^^^^^^^^^^^^
  File "/home/hgneng/zhtts/zhtts/tts.py", line 70, in text2mel
    self.acoustic.invoke()
  File "/home/hgneng/miniconda3/envs/py312/lib/python3.12/site-packages/tensorflow/lite/python/interpreter.py", line 985, in invoke
    self._interpreter.Invoke()
RuntimeError: Select TensorFlow op(s), included in the given model, is(are) not supported by this interpreter. Make sure you apply/link the Flex delegate before inference. For the Android, it can be resolved by adding "org.tensorflow:tensorflow-lite-select-tf-ops" dependency. See instructions: https://www.tensorflow.org/lite/guide/ops_selectNode number 370 (FlexRandomUniform) failed to prepare.

zhtts方面暂时没有进一步的解决思路。而Piper经过一番测试，也没有找到为什么虚拟机比物理机满10-20倍的原因。多种测试显示CPU等性能和主机差别不大。明天试试在Windows的虚拟机里安装zhtts和piper，测试它们的性能。

2026-4-14

旧的Ubuntu和eGuideDog在Windows下已无法安装，升级VirtualBox也不行，原因不明。

新的Ubuntu在Virtual 7.0下无法安装，在7.2下可以安装。Windows虚拟机下piper的表现和Linux虚拟机差不多。

下一步试试下载最新版Ubuntu 24.04，装到Windows虚拟机，看zhtts性能如何。

2026-4-15

VMWare可以安装eGuideDog 0.9.1。已经装上了zhtts，但是依然报FlexRandomUniform错误。后来，在物理机上运行conda deactivate，然后通过--break-system-packages的方式安装tensorflow等依赖。zhttsServer就不再能运行了，连之前可以运行的conda base环境也不行了。下一步试试不破坏系统的python环境，直接使用conda。

尝试build eGuideDog 26 iso，安装到最后阶段的时候报错，无法继续。

前几天能安装的Ubuntu iso文件，今天不能安装了，勾选EFI选项后就可以了。

在新安装的Ubuntu里，conda构建Python 3.12环境，安装zhtts依然报错。但是构建了Python 3.7就运行成功了。zhtts基于的https://github.com/TensorSpeech/TensorFlowTTS 是运行在Python 3.7+环境上的。至于为什么之前物理机上Python 3.12环境曾经可以运行zhtts就不知道了，可能有些久远一些的情况忘记了。

zhtts在虚拟机里合成中文的速度比piper快一个数量级，虽然有点延迟，但应该勉强可以接受。

经进一步尝试，只有python 3.7和3.8才能运行zhtts，而piper只能在python 12+上安装。最终的部署方案是：使用conda安装python环境，base里安装piper，创建py38环境运行zhtts。

2026-4-16

Ekho Segmentation Fault at enablePiper(). Don't know why. Use Valgrind to detect some issues but not solve the Segmentation Fault issue. Try to install TensorSpeech to synthesize English but fail. Plan to try RHVoice(https://rhvoice.org/)

2026-4-17

考虑到piper遇到的技术问题和不稳定情况，这个版本先保留eSpeak作为英文的朗读引擎，等zhtts运行良好后再升级英文引擎，以免崩溃的时候不知道是zhtts问题还是别的问题。

下周开始完善打包脚本、安装流程及使用教程。

2026-4-20

zhttsServer不能通过sd_ekho启动，否则会卡住，可能是一些输入输出管道的问题。计划把zhttsServer作为系统服务提前启动。

ibusreader出现了2次占满CPU的情况。似乎是进程阻塞了。停在了ibusspeech.cc:29 spd_say的位置。不知道是不是和zhttsServer返回异常有关。

ekho崩溃了一次，是sonic主动退出的：

Assertion failed: stream->newRatePosition != newSampleRate

这个页面有相关sonic代码：https://www.cnblogs.com/8335IT/p/16708777.html

第2次打包还是报错：

/tmp/tmpn9_ymy3d/mount: 文件系统类型错误、选项错误、overlay 上有坏超级块、缺少代码页或帮助程序或其他错误
dmesg(1) may have more information after failed mount system call
$ sudo dmesg
overlayfs: xino feature enabled using 3 upper inode bits.
overlay: filesystem on /tmp/tmpn9_ymy3d/upper not supported as upperdir

如果不运行chroot_custom.sh，则没有上面问题。

2026-4-21

第4次打包成功。去掉禁用/tmp挂在内存的代码后可以正常安装了。基于这一点，新版Ubuntu分配6G以上内存还是很有必要的。

直到这个版本Ekho piper还是步崩溃的：https://github.com/hgneng/ekho/tree/d8e1798ee50aa3d6440ef5863def023217470c43

似乎问题在这里引入，但是没有发现可疑的：https://github.com/hgneng/ekho/compare/d8e1798...dcb661a

把所有nullptr换回NULL也没有用，依然崩溃。

感谢“清月”反馈，按小数点会导致系统崩溃。此问题得到重现，eGuideDog Linux 0.9.1在英文模式下按小数点会导致ibus-engine-libpinyin阻塞CPU，整个系统卡死。本地还没有重现，待调研。（@todo 2，更新Ekho后解决了，应该是基于旧版speech-dispatcher的sd_ekho的bug）

eGuideDog Linux 0.9.1 CTRL+ALT+F1切换到控制台1发现espeakup并不支持中文，待解决。（@todo 3，根据https://cto.eguidedog.net/node/1247，Gnome上不支持espeakup）

2026-4-22

enablePiper()里没有return导致了栈空间异常。但是很奇怪，这个问题应该在编译阶段就可以报错，不明白编译器为什么没有这样做。

Ekho第二次出现sonic主动退出的情况：

Assertion failed: stream->newRatePosition != newSampleRate

Orca的英文语音不知道为什么变得很高音，虚拟机里面新build的系统也是一样。（@todo 4，已修复，英文采样率逻辑出错导致）

第5次打包成功。

安装程序有读屏，但是没有设置为Ekho语音（@todo 5，已通过dconf配置实现，待验证）

安装程序没有中文输入法，应该是没有安装设置好（@todo 6，应该是搞错了，SUPER+空格可切换，待验证）

安装程序基本用尽了4G内存，虚拟机应该分配至少6G内存。

2026-4-23

新系统里Orca设置语速异常，CTRL似乎也不能终止朗读。24.04里是没有问题的。经调查，语速问题应该是因为Orca新版可以为不同来源的语音做不同的语速设置。例如默认有一个速度，系统语音又有一个速度，我没有搞清楚配置的地方。

输入法似乎是正常的，只是用的是espeak的语音。

2026-4-24

虚拟机内CTRL有时终止语音很迟钝，待调查。（@todo 7，这个似乎和Gnome Terminal有关）

Orca无法读取Gnome原生Terminal内容，待解决。（@todo 8）

Gnome的读屏支持似乎还是很有问题。Mate的官方支持缺乏。尝试一下自己更换桌面，但很多依赖无法满足。尝试基于社区3月4日的daily build来做。

2026-4-27

尝试在eGuideDog 0.9.1下升级ibusreader，没有解决输入小数点导致ibus占满CPU的问题。更新Ekho后则解决了。

第6次基于Mate的打包成功。

安装盘启动过程中网络服务启动异常，无法联网。没有网络的情况下，安装程序会卡在初始白名单无法继续。（@todo 9，这个问题似乎不是必然的，再打包了一次就没有遇到，不过有可能和我更新了ubiquity有关）

安装过程提示安装过程有可用更新，应想办法在打包过程就更新。（@todo 10，snap install ubiquity --classic可解决）

安装程序刚启动的时候没有应用zhtts和piper，要dog restart两次才生效。而ibusreader则一直使用espeak的语音，无法替换为ekho的。（@todo 11，issue 1跟进）

第7个Mate包是安装成功了，但是Ekho语音用不了，切换后一会儿就被重新切换到espeak。界面是英文的。启动后有崩溃。

2026-4-28

安装官方下载的Mate iso，也会出现没有网络服务的情况。安装过程有崩溃，无法继续。

由于Mate已经难以正常使用，看来还是得基于Gnome开发。

Issue 1：Live CD没能启用piper和zhtts，dog restart反而禁用了屏幕阅读器，要手动开启屏幕阅读器，之后有piper和zhtts语音。但是ibusreader是espeak语音。这个现象和Mate一致。dog restart已生效，系统启动后会听到两次“屏幕阅读器启用”。只是输入法还没有解决。输入法问题应该是spd-say的默认语音设置问题。尝试把speech.conf添加到skel，让用户的默认语音设置生效。

找到一个关于Orca介绍的页面：https://colton.place/orca-intro-guide/ 里面提到gnome-console是可访问的，但实测并不能。Orca不会把Teminal的新输出读出来，只能通过平板复读命令去查看，非常不方便。

Issue 2: 新系统有两个智能拼音输入法，需想办法删掉一个。已通过gsetting删掉。

2026-4-29

安装最简版的Mate成功了。

Issue 3: 重启后报错：面板载入“IndicatorAppletCompleteFactory::IndicatorAppletComplete"时遇到问题。

Issue 4: 面板载入“BriskMenuFactory::BriskMenu”时遇到问题。

Issue 5: 面板载入“TrashAppletFactory::TrashApplet”时遇到问题。

Issue 3-5是最简版Mate桌面引起的错误，安装完整版就没有问题了。

第9次打包Mate桌面成功。LiveCD没有网络连接。没有网络也是有好处的，安装速度比较快。

Issue 6: LiveCD启动后没有自动启动读屏，要运行dog restart。dog restart延迟启动时间增加到15秒就好了。

Issue 7: LiveCD启动后没有中文输入法。可能和我卸载了ibus-libpinyin有关。重装ibusreader后并未能解决，可能是没有成功安装。安装过程中有报错。重新安装ibus-libpinyin后解决。

sudo: cannot execute '/usr/bin/echo': unable to open pty
sudo: cannot execute '/usr/bin/echo': unable to open pty

Issue 8: LiveCD时区不正确，安装过程也没有默认时区。已通过预配置时区解决。

VirtualBox有时有声音，有时听不到声音，不知道为什么。

第10个包，刚启动的时候听到espeak说O，然后就终止了。espeakup已成成功配置成支持中文。但是切换到espeakup后再切回Orca，似乎Orca就不能工作了。安装过程没有网络连接，但在终端下其实时有网络的，可以安装ibusreader。

第11个包，LiveCD的中文没有使用zhtts，尝试增加等待时间。安装完后第一次启动屏幕阅读器失败。第二次重新是成功的，但弹窗报错，可能dog restart的行为有点太粗暴了。

第12个包完成，主要已知问题已解决，待更新教程后明天上传iso文件发布。

2026-4-30

第13个包，移除程序崩溃的弹窗对话框，减少对用户干扰。

2026-5-7

第14个包，禁用修饰键和动作键的回响，似乎是会影响浏览功能，例如按TAB键后步读按钮内容。

不知道为什么，这个包LiveCD总是不能使用较好音质的TTS版本，不知道是不是所基于的用户配置有些不当修改，尝试基于第13个包LiveCD版本来修改orca配置。但是LiveCD没有网络，配置难以传出来。尝试基于另一个已安装版本的系统修改配置，还是不行。检查了成功的第13个包，开机延时和dog restart里sleep的秒数都没有不同。暂时没有思路。

今天尝试了一下voxin的婷婷声音，感觉不如zhtts。并且，voxin支持的版本只到Ubuntu 23.10。

2026-5-8

第16个包把dog restart的等待时间调长了1倍，问题就解决了。MD5SUM: 51ffec56df125500995f4f5f059c0bd1

关于ubuntu-mate

ubuntu-mate 不维护了吗

Mate从LTS版本中移除。变成全部都是短期的版本…

Mate从LTS版本中移除。变成全部都是短期的版本，不稳定，软件源半年就失效，只适合试用，不适合长期使用。因为我只够精力跟进2年一次的LTS升级，无法跟进半年一次的短期版本升级，所以就不再基于Mate开发了。