LLM采样后处理总结：LLM的后处理的cpp实现

LLM采样后处理总结：LLM的后处理的cpp实现在经过LLM的lm_head之后，会得到[batch, vocab_size]大小的矩阵向量，此时需要对输出的逻辑张量进行采样，除了beam_search的贪心策略，还有repetition_penalty、temperature、top_k、top