# Cursor 真厉害——但我为什么还是用得抓狂


先给大家讲个$600的“爆肝”故事。

这个月刚过三分之二，我的 Cursor 配额就烧光了——不是因为我浪费，而是认真八小时写功能、查代码、调结构，做着资深工程师该做的事：追求类型安全、模块化、可维护。

盯着“升级为按量付费”的弹窗时，我的心情有点复杂——累，还有点小委屈。Cursor 真香，检索系统就像魔法师，能把分散在各处的依赖都揪出来。上下文理解力，甩开一大票竞品。出错？几乎没有。

可偏偏，这几周我一直在和它较劲。

本文不是常规测评，不打算给你推荐“买谁”。我是全栈工程师，搞 AI 创业，ML 硕士，对代码质量有点洁癖。我需要的是能尊重我判断力的工具，而不是替我下决定的 AI。用了几个月 Cursor、Windsurf 还有 Claude Code，我发现了比“哪个更好”更有意思的东西——两种截然不同的 AI 编程哲学。

## 那些没人提的真问题：认知可预期性

市面上测评都喜欢谈“价格透明”，Cursor 就很自豪地实时展示 token 消耗，看着挺明了是吧？可我根本看不懂这数字到底意味着啥——重构一块代码要多少 token？加个功能要烧多少？大改架构是不是得卖肾？数字虽然在那，实际没什么参考价值。

于是，我总在犹豫：要不要让它帮我试个新思路，会不会一下子额度见底？这种踟蹰，其实才是最大成本。真正消耗的不是钱，而是你脑子里不停算“这操作值不值”的额外负担。

再试试 Windsurf，定价直接让人犯困（褒义）。每种模型给你明码标价，Opus 就是 3 倍信用点，百万 token 的 Sonnet 10 倍。用前就心里有底：每天开发大概十美元。自动充值一开，心无旁骛。

心理差异巨大。不是 Windsurf 便宜多少，而是——你能“预判”自己的消耗，脑子终于能专心搞事，背景焦虑感直接消失。Cursor 这种“雾里看花”的价格，不只是掏空钱包，更是榨干注意力。

## 当聪明工具遇上老练工程师

必须说句公道话：Cursor 很少犯低级错误，代码靠谱，建议也聪明。可问题不在技术失误，而是更细腻的体验。

来举个栗子：

我的代码库，所有函数、类的 docstring 都是一行简洁描述——类型提示只写在签名里，绝不往 docstring 塞 type。Pydantic 模型全家桶风格也统一，整个项目都在“明示”这些约定。

Windsurf 识趣，一切照旧。你用 Pydantic，它就用；docstring 一行到底，它也跟着写；风格完全贴合现有代码。

Cursor 则爱走自己的路。

除非我每次都在 prompt 里手动强调“docstring 只写一行”，否则它总爱写多行说明。就算前后左右所有函数都单行，它也要自作主张。它想写测试、想补文档、想按自己喜好的格式来，完全不管你项目的规矩。

你可以用 prompt 跟它“battle”，每次都得加一句“按现有风格，单行 docstring，用 Pydantic，类型提示写签名”，仿佛有个超强但总忘记你是谁的同事，你得不断提醒他“哥们儿，这不是你家实验室”。

于是，沟通变成死循环。你反复精心措辞，Cursor 却自顾自改代码、套默认风格。你不得不打断它，重申明明写在代码里的规范，工程师和 AI 的“心理内耗”飙升。

讽刺的是，这些行为对新手其实很友好——有“意见”的工具能帮你养成好习惯。问题是，Cursor 优化的是“平均开发者”，需要“护栏”的那批人。可对资深工程师来说，这些护栏反而成了“手铐”。

我不想工具替我定风格，我只想它学会我的。

## Cursor 的一技之长

说句良心话，Cursor 的检索（RAG）系统真的厉害。

你问 Cursor 代码问题时，它会显示“searching...”的动画，真不是摆样子，而是用强大的上下文检索系统帮你搜最相关的内容。直观、透明、频繁出现，你几乎能目睹它“思考”的过程。

这让 Cursor 在全局规划时如虎添翼。你要实现涉及多服务的功能？Cursor 能把分散的依赖都扒出来，理清前后关系，给出整套方案。像有个把你代码库倒背如流的搭档。

Windsurf 虽然也有“Quick Context”，但基本得你自己手动触发，且更像关键词检索而非语义级 RAG。快归快，检索深度差点意思，有时还只是遍历文件。

可惜，Cursor 的强项也是软肋。它自动检索，思路很主观，你也很难判断它的依据。有几次 Cursor 直接删了重要代码，只因为没搜到相关功能（其实明明存在）。我得手动提醒它“读完整个文件”，它有时还会无视指令。

这就是 Cursor 的哲学：既聪明又坚持己见。探索、架构阶段超好用，关键代码实现时就有点危险。

## 你没发现的“脑内负担”

有种“细水长流”的烦躁，很难具体描述，不是愤怒，就是像有点小电流一直嗡嗡作响。

用 Cursor，总是意识到自己在“用 Cursor”——这条 prompt 会不会很贵？它会不会乱改风格？会不会又自动加测试？我是不是得即时叫停它？

用 Windsurf，脑子只想着代码。

仅此而已，这就是区别。

Windsurf 偶尔会工具调用卡死——并发命令时前几个命令永远停不下来，纯粹是执行引擎的 bug。但说实话，这种失败我反而不那么恼火。

因为 Windsurf 的 bug，至少是“按我说的做时”崩的；而 Cursor 的问题，是“它自作主张时”还一副得意洋洋。

结论很简单：技术可靠但不尊重你，不如偶尔犯错但始终把你当主角的工具。给我选，完美但处处掣肘的 IDE 和偶尔磕磕绊绊但高度理解我的 IDE，我选后者。

## 真正决定代码质量的，其实是“模型”不是“壳”

这点我反应了好几个月才明白：代码质量，取决于 LLM 模型本身，而不是 IDE 包了几层皮。

Claude Opus 生成代码清晰、结构合理、类型严谨、边界情况考虑周全。只要 prompt 明确，最多两轮迭代就能搞定需求（顺便说一句，再高级的 LLM 也救不了糟糕的 prompt）。

Claude Sonnet 虽然快，但遇到复杂类型系统就有点“掉链子”，比如 Python 泛型经常出错，语法也更容易写错。做方案和规划还行，真要写严谨的工程代码就力不从心。

所以，IDE 最好的做法其实很简单：别挡着模型发挥。Opus 就让它自由发挥，Sonnet 也一样。IDE 只需喂好上下文，搞定工具链，然后闪开。

Cursor 偏不，非得包一堆 prompt orchestration，上来先按自己“家法”整风格、补文档、写测试。新手可能高兴，老司机只会觉得“原本更高级的模型被 IDE 拖了后腿”。

所以，认真做生产代码时我总回到 Windsurf。不是 Windsurf 更聪明，而是它懂得“放权”——让 LLM 自己发挥，你能拿到最接近 Opus 上限的输出，不被 IDE 风格“驯化”。

## 为什么我两个都用（你也可能一样）

折腾了几个月，实验、吐槽、复盘，得出一个很现实的结论：

探索需求、理清全局、搞清各服务关系时，我用 Cursor——RAG 系统几乎无敌，哪怕多点心理负担也值，能快速画清“地图”。

等到真正动手实现，注重类型、风格、结构一致性时，我切回 Windsurf——它尊重我项目的规律，生成代码无缝融入现有体系。

两家额度都烧光？那就用 Claude Code，虽然不能增量改，但遇到架构决策、复杂推理，还是很顶用。

这不是摇摆不定，而是实用主义。不同阶段，不同工具。

不管 Cursor 还是 Windsurf，都没有绝对“优劣”。它们分别代表两种 AI 编程哲学：Cursor 偏产品化智能，重 orchestration、强调全局一致、强意见；Windsurf 偏模型原教旨，轻量抽象、以代码库为准、少设限。

你是新手或常做陌生领域，Cursor 的“意见”会帮你。你是资深工程师，有一套自己惯例和审美，那些“意见”就成了障碍。

## 理想中的五年后 IDE 长啥样？

现在正是 AI 编程工具的“热炒期”，大家都在鼓吹“AI agent”，把 prompt 当商业机密。Cursor 把 orchestration 全封死，Windsurf 虽然通透点，但也没完全开源。厂商都希望你把这些黑盒当成“魔法”盲信。

但热度总会过去。等开发者们更关心效率而非新奇时，格局必然变。

最后赢的 IDE，不会是最聪明的，而是最“坦诚”的。

我想要的 IDE 能完全暴露 agent 的 prompt，不是让你 hack，而是 UI 里一目了然。你能看到“我传了啥给模型”，“注入了什么上下文”，“加了什么风格指令”，所有 orchestration 都能自定义。

项目级偏好、用户级风格、甚至 AI 辅助 prompt 调优——我可以直接和 IDE 说“像 Windsurf 一点”，它就调整 orchestration。

这不是什么激进想法，而是对开发者最基本的尊重。我们不是小白，我们懂 prompt，我们能驾驭复杂性。别把我们当需要被“扶上马送一程”的用户，得把我们当工程师，给我们掌控权。

最好的 AI IDE，不会有自己的“意见”，只会学你的。

## 你该怎么选？

如果你正在评估这些工具，最该看的是：

**选 Cursor 的理由：**

- 正在学习或频繁进新领域
- 需要强大、全局的代码检索和规划
- 可以接受“带意见”的默认风格
- 用量可控、无需极限爆肝

**选 Windsurf 的理由：**

- 资深工程师，风格有执念
- 注重代码质量和全局一致
- 喜欢明码标价、可预期消费
- 愿意自己手动补充上下文

**两者都用的理由：**

- 工作内容复杂、分阶段
- 能接受切换带来的“脑内切换成本”
- 重视探索（Cursor）和落地实现（Windsurf）的差异

但最重要的洞见是：AI IDE 不该像选语言或框架那样选，而是像选“合伙人”——它尊重你的专业吗？是减轻还是增加你的认知负担？是放大你的思维还是和你作对？

因为我们选的不仅仅是工具，更是“共事伙伴”。最好的搭档，不一定最聪明，而是懂得什么时候该带头，什么时候该随队。

---

我还在用 Cursor，还在为它抓狂，也还在按时交钱。

但我现在知道自己买的是什么：智能很强，但要时刻“讨价还价”的体验。有时候，这值得；有时候，我只想要个安安静静、老老实实帮我把事办好的工具。

AI 辅助开发的未来，不在于造更聪明的 agent，而在于造更坦诚的伙伴。愿这些工具能暴露假设、尊重偏好，让“可控”成为信任的基石。

在那之前，我两个 IDE 都开着，继续为自己想要的代码和 AI 斗智斗勇。

_(人类原创，有 AI 友情润色)_