拾荒志
虚怀若谷,大智若愚
首页
分类
标签
归档
关于
0%
LLM
分类
2025
大模型训练方法:DAPO
12-01
LLM 训练:GSPO 算法详解与 GRPO 对比
11-18
让 LLM 输出规范 JSON 的方法
09-15
LLM 训练:ZeRO 技术详解
07-23
LLM 训练:GRPO 算法详解
07-23
LLM 推理: KV Cache 原理与优化
07-01
LLM:RAG 中的文本检索技术
06-30
LLM 幻觉与重复问题
06-27
LLM 训练:DPO 深入与实践
06-24
LLM 训练:PPO 原理和实现细节
05-25