![AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型](https://wfqqreader-1252317822.image.myqcloud.com/cover/190/51549190/b_51549190.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3.2 生成模型的概率表示
如何从一组观察数据中学到符合要求的模型pmodel?模型pmodel可看作一条曲线,如图1-5右图所示。而神经网络可以拟合任何一条曲线,为此我们可以通过神经网络来构建模型pmodel。假设一组样本构成的数据集为χ,神经网络的参数集为θ(如可表示神经网络中权重参数w及偏置b等),我们要求的分布函数可表示为:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/18_02.jpg?sign=1739278028-hQbOP45VC25x55e5eajnIEdDHiYWw1N5-0-1c32dca9fe8520b29ac801d9e396e4c7)
对于给定的观察数据x,参数θ的似然函数(即在参数化的模型中观察到的样本数据的概率,第13章有进一步的说明)为:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_01.jpg?sign=1739278028-AFlmKvLiEp1ruUBnqpihQGCphgFj6pWB-0-0e54a7c39a957d7556c62b3a7f450597)
如果数据集χ由一组独立同分布的样本x构成,即χ={x1,x2,…,xn},则数据集χ的似然函数可表示为;
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_02.jpg?sign=1739278028-Hym3wUN3lqjHLP5zL8fP3mmdAB8QZtqC-0-c6301d4940770787c7ccf11a901a8d2f)
由于概率乘积的计算难度较大,我们一般采用对数似然函数:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_03.jpg?sign=1739278028-2gDiv9ysH1P5WIGYeCl6Bxeypc5U3zXM-0-9fc67ccfa3c783f2106f7d059f9f1820)