为了解决跳远模型和连续词袋模型在训练时需要计算词表大小的梯度使计算量太大的问题。从而有了这两个方法。
1.负采样
负采样修改了原来的⽬标函数。给定中⼼词Wc的⼀个背景窗口,我们把背景词Wo出现在该背景窗 口看作⼀个事件,并将该事件的概率计算为





2.层序softmax
不搬运了,看视频
为了解决跳远模型和连续词袋模型在训练时需要计算词表大小的梯度使计算量太大的问题。从而有了这两个方法。
负采样修改了原来的⽬标函数。给定中⼼词Wc的⼀个背景窗口,我们把背景词Wo出现在该背景窗 口看作⼀个事件,并将该事件的概率计算为





不搬运了,看视频