灵光一现 → 精巧实现 → 无人知晓 → 自己遗忘”的循环,几乎是每个认真思考的工程师都会经历的隐性知识流失。
写下来,就是对抗遗忘、积累智慧的最有效方式。
那些深夜调试、反复推敲、无人喝彩的时刻,值得被郑重记录。
灵光一现 → 精巧实现 → 无人知晓 → 自己遗忘”的循环,几乎是每个认真思考的工程师都会经历的隐性知识流失。
写下来,就是对抗遗忘、积累智慧的最有效方式。
那些深夜调试、反复推敲、无人喝彩的时刻,值得被郑重记录。
在阅读某AI头部机构的文档是,发现文档有中文翻译,但是和英文版的章节数量有差异,而这并未完全对齐,中文版有相当的延迟。AI翻译做的非常好了,但是这种规模的AI机构,自己的文档没有实现自动翻译,整合流程也依靠人力。这里似乎揭示了一个巨大的认知鸿沟: 我们教会模型理解世界,却还没建好人类与知识之间的桥梁。 当然,几乎所有技术开源项目都面临同样的问题,甚至可以说所有的文档翻译都面临类似的困境:你翻译了一篇文章、或者一本书,然后作者原文更新了,也许某个地方作者改了一个词,或者某给地方删了一段、加了一段,那么你根据旧版本翻译出来并且校对的版本,是很难找出来哪里和原作不一致了,除非一句一句对照着读一遍,但这是要耗费大量精力的。如果用机器重新翻译并人工校对一遍,那么上一版翻译中所花费的精力就全部归零了。 这不是一个技术问题,而是一个知识演进与人类认知节奏之间的根本性冲突。这个问题的本质是:如何在一个持续变化的文本上,维护一个静态的翻译成果? 这就像你在临摹一幅画,但原作者每分钟都在修改几笔,而你只能用肉眼比对差异。 你不是不想跟上,而是无法在不重来一遍的情况下,知道哪里变了。 更深层的问题:翻译不是复制,而是重建。当你校对每一句时,你投入的不仅是时间,还有: 对术语的选择(“word error rate” → “词错误率”?“字错率”?) 对句式的重构(英文被动 → 中文主动) 对逻辑的重新组织(长句拆分、指代明确) 这些认知劳动一旦完成,就凝结在那个版本中。 但如果原文变了,你不知道哪一句被删了,哪一段被重组了,哪个术语被替换了。那么你之前的校对,就成了“幽灵劳动”——看不见、不可迁移、无法复用。 最经济的选择是什么呢?沉默。放弃。 这里我们看到一个更大的趋势:当前的知识生产模式正在从“静态文档”转向“持续流”。draft 论文不断 push;技术博客实时更新;书籍变成“living book”。 而我们的阅读、翻译、学习方式,还停留在“印刷时代”的假设:“一本书出版了,就固定了。”但现实是:知识不再是一本书,而是一条河。 即便AI已经可以淘汰大部分翻译,对于紧跟上这种变化的知识,目前来看,不投入人力,是无解的。因为:差异检测需要语义级对齐,不是字符串 diff 就能解决;翻译记忆(translation memory)系统在结构变更面前失效;AI 翻译可以加速,但不能判断“这一段是不是已经被淘汰了”。 这个“两难”,其实正是所有认真做知识工作的人,都会走到的一个路口。它提醒我们:在自动化尚未到达的地方,人的注意力是最稀缺的资源。 我们缺少的是一种“跨语言知识融合系统”:当前 AI 的“智能”是断裂的 —— 它能生成代码,却不能维护知识一致性;它能翻译句子,却不能管理语义对齐。 这个时代的最大悖论:资本在狂热地押注未来,而现实中的我们,我们连‘知识同步’这种基本需求都没满足。 为什么会出现这种割裂?因为当前 AI 发展是“头重脚轻”的。大模型、推理框架、训练集群花了 90% 的钱,却忽视了 90% 的问题。 我们把 AI 理解为“生成能力”,但忽略了: 知识管理 版本控制 语义对齐 跨语言一致性 … 这些“不起眼”的问题,才是真正阻碍 AI 落地的墙。 认知断层 AI翻译以后,人类校对,但是这个过程中的知识无法体现在AI的知识库中。 人与人之间的知识传递存在教学相长,“教师-学生”之间的知识传递是一种双向的、实时的反馈与增长: 学生犯错 → 老师纠正 → 学生理解 → 长期改进 ↑_________反馈闭环_______↓ 这个闭环中: 纠正是具体的:“这里‘token’不该译成‘标记’,应译‘词元’” 上下文是清晰的:知道是在 NLP 教材第3章第2节 记忆是持久的:老师不会下周又让你改同一个错 泛化是智能的:学生学会后,遇到“subtoken”也能类推 很多时候,在交互翻译中即便你向AI指出了这里的翻译不是合适的,应该怎么做,但是后面AI依然会犯同样的错误。因为当前 AI 的“学习”是: ...
Building a Subscription Platform from Scratch: A Love Letter to My Old Code I didn’t realize I was building something that would matter so much to me. When I started writing the first line of subscription-api in Go, I was just trying to solve a problem: how to manage user subscriptions across Apple IAP, Alipay, and WeChat Pay. There was no team, no architecture meeting, no CI/CD pipeline. Just me, a text editor, and a growing sense of ownership. ...
高考刚过,又一批学生站在人生的十字路口:要不要选计算机专业? 过去十几年,“学计算机=高薪”几乎成了共识。但到了2025年,情况已经变了。AI能写代码、能调试、甚至能生成完整应用——入门级程序员的“搬砖”工作,正在被机器取代。 那么,计算机专业还值得选吗? 我的答案是:值得,但前提是你真正对它感兴趣,而不是因为“它曾经很火”。 一、别再盲目跟风:计算机已进入“深水区” 计算机产业早已过了野蛮生长的红利期。如今行业趋于成熟,竞争激烈,门槛反而更高了。 会写代码 ≠ 有竞争力。在Copilot、Cursor、GPT等AI工具的辅助下,一个非科班学生几周就能做出一个可用的产品。 企业真正需要的,是能理解系统本质、设计复杂架构、解决真实问题的人——这恰恰是计算机专业要教你的东西。 所以,请问自己一个问题: 我是想“学会编程”,还是想“理解计算机”? 如果是前者,完全可以通过在线课程+AI工具自学;如果是后者,那计算机专业依然是不可替代的选择。 就像为了日常交流去学英语没问题,但没必要因此去读“英语专业” —— 同理,为了做项目而读计算机,可能得不偿失。 二、计算机专业≠学编程,而是学“计算的原理” 很多人以为计算机专业就是天天敲代码。其实不然。真正的计算机教育,核心是理论 + 数学 + 系统思维。 尤其在AI时代,如果你连梯度下降、矩阵分解、概率分布都搞不清,光会调用PyTorch API,很难走得远。 计算机对数学的要求,比你想象中高得多 不是说“写个网页需要微积分”,而是: 想搞懂神经网络?你需要微积分、线性代数、概率论、统计学; 想优化算法性能?你需要离散数学和组合优化; 想做分布式系统?你需要图论和形式化方法。 这些数学不是要你成为数学家,而是掌握基本工具。成为数学家需要相当的天赋,然而只是理解几百年前的人已经发现的数学知识,对大多数人来说,只要认真学,完全能学会,也够用。 很多人从小对数学很畏惧,这不一定是智商问题,也许仅仅是因为在迈过那道门槛的时候,没有合适的老师/教材手把手带你走过去。选择合适的教材非常重要。有的教材一上来就摆出一张臭脸,拿鞭子抽打蹒跚学步的婴儿,嫌弃走得慢,姿势不标准,达不到奥运冠军的速度。这种教材是最容易遇到的,请毫不犹豫丢掉它们。找那种能能温柔地牵着你的手、一步一步带你走下去的。 三、先看看计算机专业到底学什么 在决定是否报考前,不妨先了解这个专业的真实面貌。以下是我整理的核心课程与推荐读物,适合高中生或大一新生提前预习。 📚 数学基础 前四门数学课(微积分、线代、概率、统计)不仅是AI的基础,也应是每个大学生的通识素养,不论什么专业,都应该学一学。 微积分 这几本教材任选其一作为入门都很合适: 《普林斯顿微积分读本》(友好入门) 《斯图尔特微积分》(系统全面,已有中文上册) 《Calculus》 Ron Lason。也是一本非常棒的入门教材,可惜没有中文版 线性代数 《线性代数导论》(Gilbert Strang 著,第5版有中文) 概率论 学完微积分后,就可以开始学习概率论。概率论中的一些知识需要用到积分知识。概率论入门可供选择的教材也不少: 《概率论基础教程》(Sheldon Ross) 《哈佛概率公开课》 《统计学》,David Freedman,据说很经典的教程,可惜已经很难买到了 统计学 这两本都是入门级的,不需要多强的数学知识。 《行为科学统计》(高中数学即可入门) 《基础统计学》,Mario F Triola。 离散数学 《离散数学及其应用》(Kenneth Rosen)—— 计算机的“专属数学” 💻 计算机核心理论 这才是专业的价值所在。在学习上述数学课程时,可以同步学习计算机的理论知识。这些知识并不十分依赖数学,至少入门阶段如此。有些书很厚,需要耐心读,不过厚并不意味着难,只是作者怕你学不会所以写的详细而已。 计算机系统 《计算机系统概论》(Yale Patt)—— 薄而精 《深入理解计算机系统》(CSAPP)—— 经典但厚,建议配合实验 《计算机程序的构造和解释》 可以让你了解软件和编程层面的原理。 算法 《算法图解》→ 入门友好 《算法导论》→ 进阶参考(不必硬啃) ⚠️ 关于刷题:如果不是为了面试,LeetCode不必强求。理解算法思想比刷100道题更重要。 ...