1. 主页 > seo工具

水电费过户需要什么资料,sdfghjkl

根据transition-id,我们可以得到每一帧对应的phone,如下: 这一步构建的训练图将在后面分母fst和分子fst的构建中使用。链式模型不需要提前训练CE准则DNN模型;而是直接使用CD-HMM-GMM模型得到每个句子的比对结果,然后生成分子fst。

2.同时,为了将每个句子分割成小块,链模型还会将分子格转换为分子fst(因为fst可以保留时间对齐信息,更容易根据时间将其分割成块) )。由于链式模型采用帧下采样(每三帧取一帧),也就是说帧移变为30ms,而不是10ms,因此帧率是传统神经网络声学模型的三分之一;第三列和第四列是pdf-id(与输出相同,实际上是FSA)。



肾多发钙化灶怎么回事



1、肾多发钙化灶怎么回事

链模型是在phone级别训练的,所以需要以phone为单位进行对齐,如下图: 可能看了上一张图,你还有疑问,为什么pdf-之间会有pdf-id ID 218? 253呢?然而链模型的语言模型是音素级别的,所以我们在构图时不需要发音词典。其实结构就是HCP(P表示phone LM,HCP是fst结构,所以叫分母fst)。



神都富贵花是什么意思



2、神都富贵花是什么意思

lattice和fst的区别在于fst中编码了时间对齐信息,这可以方便我们根据时间点来分割整个音频片段。链式模型实际上是一种序列判别训练方法,因此它还构造了分母fst和分子fst。因为fst中有时间对齐信息,所以我们可以很容易地将整个fst分成小块,如下图所示:



山东仿古候车亭批发



3、山东仿古候车亭批发

链式模型的分母fst实际上是HCP(P代表发音词典的概率),也就是说所有音频共享同一个HCP图,不需要单独解码得到对应的格子,所以称为格子自由的。

从这张图中我们可以看到跳帧采样的现象。理论上,音素sil对应41帧(可以通过上一张phone打平图中sil对应的transition-id号得到),但现在是13帧(通过上一张图,1和218(都是1和218) 218对应音素sil),可以得到连续出现的次数)。

本文由阿俊seo优化发布,不代表阿俊seo优化立场,只提供参考,不作为依据,同时不提供任何服务与建议,转载联系作者并注明出处:http://yzf315.com/gj/51948.html

联系我们

在线咨询:点击这里给我发消息

微信号:

工作日:9:30-18:30,节假日不休息