Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

为什么英文TikTok,念出来会是T I K T O K? 是一个字母一个字母念的啊? #1933

Open
skyhhuc opened this issue Jan 14, 2025 · 7 comments

Comments

@skyhhuc
Copy link

skyhhuc commented Jan 14, 2025

为什么英文TikTok,念出来会是T I K T O K? 是一个字母一个字母念的啊? 第一次遇见把单词拆开来念的,我输入xiao hong shu他甚至都可以识别,但是tiktok这个单词无法识别,而是一个字母一个字母念。。。有哪里需要更新的吗?
123654

@DestoryVIP
Copy link

我记得英文有一个热词文件,改那个热词文件,然后标上因素就OK 了

@skyhhuc
Copy link
Author

skyhhuc commented Jan 16, 2025

我记得英文有一个热词文件,改那个热词文件,然后标上因素就OK 了

兄弟,麻烦截个图。我感觉这个有训练的声音克隆效果还是比较好的,比F5要好不少,但是就是T I K .T O K念出来,我人傻了

@Cosmo-klara
Copy link

我记得英文有一个热词文件,改那个热词文件,然后标上因素就OK 了

兄弟,麻烦截个图。我感觉这个有训练的声音克隆效果还是比较好的,比F5要好不少,但是就是T I K .T O K念出来,我人傻了

看看shell里面处理的结果呢?切分后和前端处理后的那个结果

@skyhhuc
Copy link
Author

skyhhuc commented Jan 16, 2025

我记得英文有一个热词文件,改那个热词文件,然后标上因素就OK 了

兄弟,麻烦截个图。我感觉这个有训练的声音克隆效果还是比较好的,比F5要好不少,但是就是T I K .T O K念出来,我人傻了

看看shell里面处理的结果呢?切分后和前端处理后的那个结果

其他单词都没问题,就tiktok是一个字母一个字母念出来的,我也尝试了tik tok分开,也是念字母。参考音频是没有这个tiktok的,这是我需要合成的语音里面的文本

@Cosmo-klara
Copy link

我刚刚测试了一下Tiktok,确实不是预处理的问题,那你可以参照这个自定义音素 #1728

@skyhhuc
Copy link
Author

skyhhuc commented Jan 16, 2025

我刚刚测试了一下Tiktok,确实不是预处理的问题,那你可以参照这个自定义音素 #1728

是不是也是一个字母一个字母的读出来?改代码我怕到时候这边改那边又出问题,有没有什么bug修复的模式,或者大佬参考隔壁的F5-TTS看看,因为我用那个就没有问题,正确识别,但是F5克隆的声音不如这个像

@skyhhuc
Copy link
Author

skyhhuc commented Jan 16, 2025

我刚才又尝试了用包含tiktok这个单词的音频区克隆,结果合成的文本包含tiktok该词的时候,仍然无法有正确的读音。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants