已经接近 3 年没有更新博客了。今天立下一个 flag,开始准备 LLM 面试知识,主要是八股文为主,想到哪写到哪。第一篇没想到写啥,觉得对 PPO 和 DPO 比较了解,就先直接写这个吧。
图像生成基础-DDPM
目前所采用的扩散模型大都是来自于2020年的工作DDPM。DDPM对之前的扩散模型进行了简化,并通过变分推断(variational inference)来进行建模,这主要是因为扩散模型也是一个隐变量模型(latent variable model),相比VAE这样的隐变量模型,扩散模型的隐变量是和原始数据是同维度的,而且推理过程(即扩散过程)往往是固定的。
vscode C++ 开发之使用 clangd、C/C++、clang-format
最近比较忙,废话少说,vscode 开发 C/C++ 需要很繁琐的配置,之前也说过 launch 和 tasks 的配置。这篇文章主要结合自身使用经历讲讲 C++ 相关插件。
shared_ptr 和 unique_ptr 深入探秘
C++ 中 shared_ptr
和 unique_ptr
是 C++11 之后被广泛使用的两个智能指针,但是其实他们在使用上还是有一些“秘密”的,我根据平时遇到的两个问题,总结记录一些知识。
SSH 穿越多个跳板机的连接方法
鉴于安全原因,工作需要使用跳板机登录;鉴于服务器环境老旧,我需要在服务器上使用 docker 来搞个开发环境,所以需要有一种方法穿越层层阻隔,让我的 vscode 直接连过去。