拾荒志
虚怀若谷,大智若愚
首页
分类
标签
归档
关于
0%
LLM
分类
2025
LLM 训练:ZeRO 技术详解
07-23
LLM 训练:GRPO 算法详解
07-23
LLM 推理: KV Cache 原理与优化
07-01
LLM:RAG 中的文本检索技术
06-30
LLM 幻觉与重复问题
06-27
LLM 训练:PPO 和 DPO
06-24
2024
大模型 RLHF 训练中的 PPO 算法细节
07-25