关于网站

公众号@小林面试笔记大约 13 分钟约 3881 字

小林面试笔记：图解Agent+RAG+大模型面试题，让一部分人先跑赢AI Agent开发面试

大家好，我是小林。

老读者都知道，我 4 年前上线了 xiaolincoding.com 这个网站，它沉淀了我过去 5 年在公众号分享过的图解文章，图解网络、图解系统、图解 MySQL、图解 Redis 这些系列都在上面，还有 1000+ 道后端面试题。

相信不少读者就是从这个图解网站一路关注过来的。这些年我也收到很多反馈，说图解网站对面试帮助很大，每次看到这种消息我都挺开心，也挺有成就感，自己写的东西能真正帮到大家。

稍微吐槽一下自己，上面这张读者反馈图还是我 22 年整理的，图片都快用包浆了，一直没腾出手整理新的，没办法实在太懒了哈哈，能用就行。

我公众号早些年的内容，基本都是围绕图解 Java 后端技术栈来写的。但今年开始，不只是你们觉得 AI 发展太快，我自己也是实打实地感受到了这股浪潮。

所以就在今年过完春节，我开始全力拥抱 AI 方向的内容来写，依旧硬核+图解，目的也很简单，想让我的读者们能在 AI 时代不掉队。

而且不少文章的阅读量都超出了我的想象，好几篇这类硬核图解文章都破 10w+ 了。

经过好几个月的爆肝，现在 AI Agent、AI 编程、大模型这些方面的图解内容也攒得蛮多了。

所以今年我上线了新网站，叫「小林面试笔记（xiaolinnote.com）」，专注图解 Agent + RAG + LLM 大模型面试题，让一部分人先跑赢 AI Agent 开发岗位。

网站地址：https://xiaolinnote.com
PS：对了，网站的内容是可以免费看的

话说回来，免费可不代表粗制滥造，网站里的每一篇内容，都是我当成精品来打磨的。

网站上线之后，收获到了不少读者的肯定和认可，也给我很大动力，让我更坚定持续往这个方向输出。

比如有做了几年的大模型工程师读者，说网站的内容太实用了，直呼相见恨晚；也有面了一圈 Agent 开发岗的社招同学跟我说，新网站的 Agent 面试题押得很准，面试遇到的问题基本都能在里面找到原题。还有本科大二的同学，靠着网站的 AI 大模型面试题拿到了大厂 offer，面试问到的东西基本全会，全是在我公众号文章和网站上学的。

而且让我比较意外的是，新网站才上线几个月，就被 AI 推荐了。

这个新网站我之前还没怎么在公众号正式宣传过，只在朋友圈小小地吆喝了一下。

所以这次就来跟你们正式介绍一下，这个网站更新了几个月，目前都有哪些内容。

大模型面试题

这是网站目前内容最厚实的一块，专门盯着 AI Agent开发方向的高频面试题来写，目前分成「Agent、RAG、工具调用、大模型工程」四个专题，当然后续还会持续增加。

74 道大厂真实高频面试题（Agent / RAG / 工具调用 / 大模型工程）
615 张图解配图，复杂原理一张图看懂
25 万+字详细答案解析，每题都讲到能自己推导

题目全是我从网上各种真实面经里一道道抠出来的，都是大厂真问过的，不是自己拍脑袋编的。每道题我不光给答案，还会把背后的原理从根上讲透，再配上图解，让你不是死记硬背，而是真的搞懂了，面试官换个角度问你也不慌。

Agent面试题

Agent 现在是 AI 工程岗绕不过去的必考题，但网上的资料要么停在「Agent 就是大模型加工具」这种概念层，要么上来就甩一堆框架代码，看完还是不知道自己的 Agent 该怎么设计。

这块从 Agent 是什么、和直接调大模型有什么本质区别、核心组件有哪些这些地基讲起，再往下拆 ReAct、Plan-and-Execute、Reflection 三种设计范式，以及记忆系统、任务拆分、Multi-Agent 协作这些工程难点。

几个最容易被一句话带过、面试官却特别爱深挖的点，都单独拎出来讲：

Agent 和 Workflow 到底差在哪，什么时候该用哪个？
ReAct、Plan-and-Execute、Reflection 三种范式怎么选型？
长期记忆和短期记忆分别放哪、怎么存？上下文太长了又怎么压缩？
为什么有时候宁愿「手搓」Agent，也不肯用现成框架？
单 Agent 和多 Agent 怎么选？多个 Agent 之间又怎么协作和切换？

Agent 这东西，难的从来不是把它跑起来，而是怎么把它的不确定性，关进一个可控的边界里。

RAG面试题

很多人对 RAG 的理解，还停在「文档切块、转向量、检索」这三步。Demo 阶段这么搞确实能跑起来，可一旦上了生产环境，麻烦就一层层冒出来了。

文档切多大合适，切大了召回不准、切小了上下文又不够？语义被切断了怎么补救？
向量库到底选 Milvus、pgvector 还是 Elasticsearch？
多路召回、Query 改写、Rerank 这些又该卡在流程的哪一环？

这块就从 RAG 的完整流程讲起，把文档切割、Embedding 选型、向量数据库、检索优化、Query 改写、多路召回、GraphRAG，一直到幻觉规避和效果评估，一块一块拆开。

RAG 最容易被低估，看着不就是「查一下资料再回答」嘛，可真正做起来，全是细节。

LLM工具调用面试题

做 AI 应用，光让大模型能聊天远远不够，你得让它能查数据库、能调 API、能动文件，说白了就是得让它会「用工具」。

可一到面试，Function Calling、MCP、SKills、A2A 这几个词很多人就开始打架了，只知道「都是调工具的」，再往下问就分不清谁是谁。

这块顺着工具调用的整条链讲，从 Function Calling 的原理和训练，到 MCP 协议的架构与组成，再到 A2A、Agent Skill，以及底下的 SSE / WebSocket / WebRTC 通信和 LLM 网关。

最容易被问到打结的，是这几个东西的边界和层级：

Function Calling 到底是什么，模型又是怎么学会调工具的？
MCP 和 Function Calling 差在哪，什么场景该用哪个？
Skill、MCP、Function Calling 三者各自解决什么问题、又是什么层级关系？
A2A 是来干嘛的，和 MCP 有什么不一样？

把这条链捋顺你会发现，它们不是互相替代，而是一层套一层：Function Calling 是模型的「语言」，MCP 是统一的「工具箱」，Skill 是教它把活干漂亮的「操作手册」。

大模型工程面试题

先把话说在前头，这块面试题的分量跟前面几块不太一样，它更偏大模型算法和底层原理，难度确实要高一截，是大厂面大模型工程师、算法岗时，真正会往深里挖的部分。

内容顺着五条主线展开：Transformer 架构、训练流程、推理优化、Prompt 工程、评测选型。从位置编码、分词器，到 Scaling Law、LoRA、RLHF / DPO / GRPO，再到 KV Cache、量化、MoE、推理框架选型，一路讲下来。几道高频题比如：

Attention 公式里为什么要除以 √d_k？
MQA、GQA、Flash Attention 分别在优化什么？
GRPO 凭什么能砍掉 Value Model，跟 PPO、DPO 又差在哪？
KV Cache 和 Prompt Caching 是怎么把推理成本压下来的？
同样都能跑，你的项目为什么偏偏选这个模型，不选那个？

这些题，网站里都配着图一道道讲透了。

可能有做 Agent 开发的同学会问：这块我得全部吃透吗？

当然不用，这一点网站里我也替你想到了，专门按「跟 Agent 开发的相关度」把这 22 道题分成了三档优先级，哪些必看、哪些选看、哪些时间紧可以先跳过，都给了针对性建议，照着安排时间就行。

图解Agent

如果说前面的面试题是「一道一道地抠知识点」，那这个「图解 Agent」专栏就是「一个主题一篇万字长文，帮你把体系彻底搭起来」，每篇都配着大量图解，把一个方向从头到尾讲透，看完是真能在脑子里拼出一张完整的图。

Agent概念与生态

Agent 到底是不是就「大模型 + 工具」这么简单？它跟你平时调 API 的本质区别又在哪？

这块我用一篇万字长文从零把 AI Agent 讲透，从它的定义、核心组件一直讲到运行机制，一步步带你把认知地基打牢。

光懂概念还不够，我还专门拆了 OpenClaw 这个开源生态。看完你不光知道 Agent 是什么，还能看清现在整个圈子都在玩些什么，面试时被问一句「最近 Agent 圈有什么新东西」也不至于卡壳。

RAG检索增强

RAG 的文章网上一搜一大把，但能把原理和进阶一次讲明白的真不多，大多要么浮在表面，要么直接甩你一堆论文。

这块我先用一篇长文带你吃透 RAG 到底怎么跑起来，从文档切割、向量检索到最后生成，整条链路配着图一点点拆。

吃透基础之后，再单开一篇把这两年特别火的 GraphRAG 和 LightRAG 掰开揉碎，原理、对比、到底什么场景该用哪个，全给你讲透。

这块是 RAG 进阶绕不开的硬骨头，啃下来，你就能甩开一大票只会「普通向量检索」的人。

Agent工程方法论

这块大概是整个专栏里最前沿的部分了。

你有没有发现一个现象：同样一个模型，怎么有的人用起来就是比你聪明、产出就是比你强？秘密很大程度上不在模型本身，而藏在工程方法里。

我专门写了 Harness Engineering 和 Loop Engineering 这两篇，讲清楚 AI 编程是怎么从「写一句 Prompt」一步步进化到「设计一整个 Loop」的。

这是今年才慢慢成型的新理念，懂的人还不多。这套思路一旦吃透，你对 Agent 的理解会直接上一个台阶，不管是面试还是自己做项目，都能甩开还停在「调 Prompt」阶段的人。

图解 Claude Code

Claude Code 现在基本是公认最强的终端编程 Agent 了，看到源码泄漏之后，干脆专门开了个专栏，从实战一路扒到源码。

市面上讲 Claude Code 的内容不少，但大多停在「怎么装、怎么用」这一层。

我想做的不太一样，一边带你把它用顺手，一边带你钻进源码里，看看最强 Agent 的底层到底是怎么设计的。不管你是面试被追问实现原理，还是日常想提效，都能在这里找到答案。

Claude Code 实战技巧

光会装、会用还不够，怎么把 Claude Code 用出花来才是关键。这块全是能直接上手的干货：新手入门的基础技巧、官方 /powerup 的 18 个互动课程全解析、CLAUDE.md 这个项目记忆文件到底该怎么写，还有一篇专门讲它怎么扛住百万行的大型代码库。

这些都是实打实的实践经验踩过的坑才总结出来的经验，每篇看完就能用起来的，照着调一遍，你的 Claude Code 使用效率能肉眼可见地往上走。

Claude Code 源码解析

你有没有好奇过，Claude Code 一轮对话背后到底是怎么跑起来的？这块是我下了最大功夫、也最舍得花时间的地方，直接扒着它 51 万行泄漏源码，把核心设计一个个讲透。

主循环 Query 怎么转?
上下文满了怎么 Compact 压缩?
代码检索为什么用 grep 而不上 RAG?
记忆机制为什么不碰向量数据库?
多 Agent 的 SubAgent 又是怎么实现的?

这些平时你根本看不到的细节，我都配着图给你拆开了。

而且读源码的意义不只是面试能答上来。看懂了最强 Agent 是怎么设计的，等你哪天自己动手做 Agent，心里就有一套可以照着抄的标准答案了。看完你大概率会冒出一句：哦，原来最强 Agent 的底层，也没那么玄乎。

总结

回过头看这几个月，说实话还有点恍惚。

年初过完春节才下决心全力转 AI 方向，本来只是想着别在这波浪潮里掉队，没想到一路爆肝下来，竟然攒出了这么多图解硬核内容，网站也慢慢长成了现在的样子。

写的过程其实挺熬人的。AI 方向变化太快，常常是一篇刚写完，过几天又冒出新东西，得回头补、回头改。

但每次看到有读者留言说「靠着网站的题上岸了」「这篇看完总算搞懂了」，那点疲惫一下子就全值了。

网站里的每一篇，我都是照着精品的标准在死磕每一张图、每一句话。原因其实很简单，我希望这个新网站，能像 4 年前的 xiaolincoding.com 一样。

那个网站上线到今天 4 年了，依然有大量同学天天在上面复习、备战面试。我也希望「小林面试笔记」能成为这样的存在，不是看完就忘的快餐，而是经得起时间考验、过几年回头看依然能帮到你的硬货。

当然，这只是个开始。Agent、RAG、Claude Code 这些方向我还会接着往深里写，网站也会一直更新下去。

如果你也走在 AI 这条路上，希望「小林面试笔记」能陪你走一程。

最后，网站地址我再贴一次：https://xiaolinnote.com ，完全免费，欢迎收藏。

要是觉得有用，也帮我转给身边正在找工作、想转 AI 的朋友，就是对我最大的支持啦。