AI Coding 从小工到专家

February 09, 2026

前言

过去一年是 AI Coding 在整个业界爆发的一年,Claude Code、Codex、Cursor 等 AI 编码工具覆盖了海量的程序员甚至不少“麻瓜”也在积极尝试 “Vibe Coding”,过于一年善用此类工具的人产出已经得到了极其显著的提高。
对于居住在中国大陆的人来说,要想畅通无阻的使用这些海外的顶级 AI 工具通常会面临各种各样的问题。
本文会分享我过去几年在使用 AI 工具方面的一些心得体会。

地区限制

中国大陆、香港、澳门这几个地区被大量主流 AI 厂商限制提供服务,也就说人家明确禁止这些地区的人使用,不给你提供服务。像 Anthropic CEO 甚至公开放话要 Ban 掉背后是由中国公司控股的马甲公司。

所以,需要先解决自己的网络环境和付款方式等。一般来说美区 Apple ID + 美区 Apple Gift Card 可以相对低成本,省心的解决支付问题。(谨慎在淘宝闲鱼购买礼品卡,容易秋后算账被封号)

网络方面,最好是通过 clash、sing-box、surge 之类的支持自定义代理规则的工具让海外 AI 相关的域名走单独的代理,最好是你自己独享的比较干净的 IP。可以在这里 https://ipinfo.io/ 查看 IP 质量。有时候你可以通过 surge 的链式代理让落地 IP 走自己私有的 VPS IP,这样既能保障访问速度又避免和其他人共用 IP。

由于 Anthropic 和 OpenAI 域名在国内可直连,在自己家的路由器和电脑 hosts 上最好将相关域名屏蔽掉,避免因为代理软件重启或者异常退出导致正在进行中的连接瞬间走了直连,容易被风控。

应该如何选择 Agent 框架

这里的框架是指 ClaudeCode、Codex、OpenCode 之类的 CLI 或者 App。

就目前而言,GPT Pro 和 Claude Fable 这类模型依旧是没有代替,所以推荐的方案是 Claude + ChatGPT 订阅双持,再配合 Grok 或者 OpenCode 可以用来日常相对简单的任务。

开源模型方面,GLM 5.2 以及 Kimi k2.6、k2.7-code 都是相对不错的模型,不过目前很多国内开源模型一大问题是很多都不支持多模态,也就是无法给它图片输入。在前端 UI 层面这点很重要。

一些框架层面的使用心得

在 TUI 方面,也就是直接在命令行终端使用的场景,Claude Code 是目前综合最好用功能最强大的,包括 Codex CLI 和它比起来都差了不少,其他的就 OpenCode Grok 之类的就更不用说了。

如果你用不惯 TUI,在 GUI 方面目前 Cursor 和 Codex Desktop 是相对最好用的。

如果只能选一个就选 Cursor。

优先使用自动审批

这是一个很好的折中,不要完全敞开权限,也不要默认每次都手动审批。
这点 Claude Code 和 Codex 做的比较好。

codex 相比其他框架有个 sandbox 机制,默认很烦人,会导致很多跨目录场景被限制,最好把 sandbox 设置成 full-access, 审批模式改成 Auto (approval for me)

轻量化 AGENTS.md

对于全局 AGENTS.md 应当尽可能保持轻量,随着模型进步,说多了反倒影响模型发挥。并且容易自相矛盾。每隔一段时间重新 Review 你的 AGENTS.md,并做一些删减。

轻量化 skills

千万不要看到一堆技能直接一键安装到全局,技能多了也会互相冲突,并且有些技能会过于刻板,反倒限制模型发挥。

一些模型的特点

每个模型都有自己独特的地方,甚至不可代替的地方。

grok 自带高性能的实时检索 x 内容,并且整体内容尺度比较宽松,不会动不动拒答或者教育你。

gemini pro 在语言文字方面独树一帜,有时候读它的文字你会心旷神怡。

gpt 5.x 的文字能力非常差,黑话之类的非常多,曾经的 4.5 模型在语言方面是 gpt 家族最顶级的,甚至比 gemini pro 都要好不少,可惜最近已经下架了。据说成本太高。gpt 在上下文自动压缩方面独树一帜,虽然只有 200多k上下文,但配合它的服务端自动上下文压缩,可以连续运行几十个小时。

glm 5.2 在中文方面表现相对不错,整体除了速度稍微慢点和没多模态,还是不错的。

单纯逻辑推理,fable 和 gpt pro 目前是最强的。gpt 5.5 次之。

工具调用方面,sonnet 5 和 opus 系列都是明显要比其他模型好的。

总给

通过躬身入局,你才能感受的 AI 当前的能力和边界。才能感受到它对整个人类世界的冲击。进而引发你更多关于自己独特价值的思考。

对于可以自闭环验证的任务是最容易被 AI 代替的,例如编程就是典型的场景。很多知识类白领的工具会受到冲击。

不过,AI 并不能完全帮助一个初级、中级的人一下子变的突然生产力爆炸。反倒是实践经验越丰富,架构经验越资深的人可以更显著的发挥好 AI 的能力。原因很简单,当你不知道自己不知道什么的时候,很难让 AI 正确的触发特定回路。

所以要区分 Demo 和真正生产级别的能力,AI 可以快速弄一个看似像那么一回事的东西,但没有靠谱的舵手,很难稳定走完整个航程。

如果你喜欢我的内容,请考虑请我喝杯咖啡☕吧,非常感谢🥰 。

If you like my contents, please support me via BuyMeCoffee, Thanks a lot.