小白不明白。我也看过相关的文字和视频,但我还是不明白。谁能把这些基本的事情解释清楚吗?非常感谢! 如上,声学和唱法模型都要做吗?还是只做一个就行,最佳实践是什么呢? 原文中有这样一段话: 简单地说,歌唱模型的输出是具有可用于声学模型推理的歌唱参数的DS文件。 因此,在训练变奏曲歌唱模型之前,训练声学模型进行模型推理 更加困惑 我认为这是一个伟大的项目,非常感谢大家!