大模型的理解

大模型的理解 1.注意力机制的数学公式做softmax归一化得到注意力权重最后乘以V得到最终输出的特征向量