0%

继续准备 LLM 面试知识,这次写文本检索技术。文本检索是 RAG(检索增强生成)系统的核心组件,也是面试中经常被问到的问题。本文将详细介绍稠密向量检索、稀疏向量检索、BM25算法以及混合检索策略,帮助理解现代文本检索系统的技术原理。

阅读全文 »

LLM 的幻觉和重复问题是 LLM 应用中的核心挑战,也是面试中经常被问到的问题。本文将从底层机理出发,深入分析这两个问题的成因,并探讨有效的解决方案。

阅读全文 »

目前所采用的扩散模型大都是来自于 2020 年的工作 DDPM。DDPM 对之前的扩散模型进行了简化,并通过变分推断(variational inference)来进行建模,这主要是因为扩散模型也是一个隐变量模型(latent variable model),相比 VAE 这样的隐变量模型,扩散模型的隐变量是和原始数据是同维度的,而且推理过程(即扩散过程)往往是固定的。

阅读全文 »

golang 中的协程使用非常方便,但是协程什么时候结束是一个控制问题,可以用 select 配合使用。

阅读全文 »

C++ 中 shared_ptrunique_ptr 是 C++11 之后被广泛使用的两个智能指针,但是其实他们在使用上还是有一些“秘密”的,我根据平时遇到的两个问题,总结记录一些知识。

阅读全文 »