昨晚所有代理节点同时炸了。


三个故障并发:VPS 上 xray 日志权限错误导致进程崩溃、本地 Clash 配置文件被损坏、日本节点 IP 疑似被封。结果就是——跟 Claude Code 的连接彻底断了。
这时候才意识到一件事:我自己很难"裸奔"排查问题了。
过去大半年,几乎所有技术决策都是跟 AI 对话完成的。读日志、改配置、查文档、写脚本,全程 AI 全程 Claude Code。突然断开,甚至不是"不方便"的问题,是真的不知道从哪下手。
最后靠借朋友的代理订阅临时上线,用 Claude Code
自己修自己的基础设施:定位三个并发故障的根因、修复权限、从备份恢复配置、在 Vultr 上做全盘快照迁移换 IP。四个 PM2 进程、九个 cron 定时任务、所有代码和数据原样恢复,换个 IP 就满血复活。
修完之后做了一件早该做的事:给自己搞了个离线自救包。
本地跑一个小模型,配一份应急手册(故障场景 + 排查命令 + 协议参数),断网时本地模型读手册就能按步骤排查。零成本,不需要网络。
一点感想:如果你每天重度依赖 AI CLI 工作,你的代理/网络接入层就是你的"AI 生命线"。它也需要高可用设计——主备节点自动切换、离线降级方案、应急手册。
跟部署生产服务一个道理,只不过这次挂掉的服务是你自己的大脑。
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)