0%

已经接近 3 年没有更新博客了。今天立下一个 flag,开始准备 LLM 面试知识,主要是八股文为主,想到哪写到哪。第一篇没想到写啥,觉得对 PPO 和 DPO 比较了解,就先直接写这个吧。

阅读全文 »

目前所采用的扩散模型大都是来自于2020年的工作DDPM。DDPM对之前的扩散模型进行了简化,并通过变分推断(variational inference)来进行建模,这主要是因为扩散模型也是一个隐变量模型(latent variable model),相比VAE这样的隐变量模型,扩散模型的隐变量是和原始数据是同维度的,而且推理过程(即扩散过程)往往是固定的。

阅读全文 »

golang 中的协程使用非常方便,但是协程什么时候结束是一个控制问题,可以用 select 配合使用。

阅读全文 »

C++ 中 shared_ptrunique_ptr 是 C++11 之后被广泛使用的两个智能指针,但是其实他们在使用上还是有一些“秘密”的,我根据平时遇到的两个问题,总结记录一些知识。

阅读全文 »

鉴于安全原因,工作需要使用跳板机登录;鉴于服务器环境老旧,我需要在服务器上使用 docker 来搞个开发环境,所以需要有一种方法穿越层层阻隔,让我的 vscode 直接连过去。

阅读全文 »