
三个月前,Shopify 的联合创始人兼 CEO Tobi Lütke 在公司内部发布了一封全员信,决定「All in AI」。Lütke 提到,「有效地使用 AI 技术是对 Shopify 每位员工的基本期望。」这种做法随后引来众多效仿,包括 Box、Fiverr 乃至加拿大总理。
三个月后,Shopify 内部实际发生了什么样的变化?仅仅是领导者的一句「激情口号」,还是真的在企业内部有效地用起了「AI」?
AI 的落地,改变了哪些工作流程?

First Round Review 与 Shopify 的副总裁 Thawar 进行了对谈,Thawar 分享了公司对于引用 AI 的具体策略以及实际提升效果,同时分享了三个「反直觉」的 insights。
-
全员无差别用 AI,不设费用上限。
-
让 AI 更多展示思考和结果,而不是隐藏。
-
新手和毕业生很有用,尤其是 AI 使用上。
可以说,在 AI 如何在公司落地这件事上,从战略指导到技术落地,Shopify 给了一个很好的示范。
基于 First Round Review 的文章,Founder Park 进行了编译处理。
原文:https://www.firstround.com/ai/shopify
超 10000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

-
最新、最值得关注的 AI 新品资讯;
-
不定期赠送热门新品的邀请码、会员码;
-
最精准的AI产品曝光渠道
01
全员「无差别」使用 AI

许多公司在推广 AI 时,往往只向全员开放最基础的工具,而将更强大的模型和应用保留给技术团队。Shopify 的做法恰恰相反:它允许所有员工使用公司引入的每一款工具和模型。
这种策略背后的逻辑是,高价值的创新应用可能来自公司的任何一个角落,你根本无法预判哪一个会最终脱颖而出,成为最值得投入资源的用例。
我去年采购了 1,500 个 Cursor 授权,但很快就发现供不应求,不得不追加了 1,500 个。而增长最快的用户群体并非来自工程部门,而是来自客户支持和营收部门。
Farhan Thawar 法尔汉·塔瓦尔 Shopify 工程副总裁兼负责人
为了鼓励员工真正用上最好、最新的模型,Shopify 采取了以下三大策略:
策略一:让法务团队默认「开绿灯」
变革始于高层。包括法务在内的整个高级领导团队必须达成共识:拥抱 AI 是公司最重要的事。最高层的一致性意味着,在面对安全、隐私等关键议题时,所有人都必须以「如何促成」为出发点。「如果你不把『同意』设为默认选项,那你实际上就是在默认『拒绝』,」 Thawar 指出。「如果规则模糊不清,那实际上就等于不行,大多数公司都如此。」
2021 年底,当 Thawar 决定引入 GitHub Copilot 时,他与法务团队的沟通很直接:「我第一句话就是,『我们准备上这个项目,如何才能确保万无一失?』」 Thawar 说。「他们回答,『我们来想办法。』没有任何反对意见。」
这种态度,与其他顶尖科技公司 CTO 们的遭遇形成了鲜明对比。在一个同行的 WhatsApp 群里,Thawar 经常听到他们抱怨来自法务的重重阻碍。
群里总有人问我:『能让你们的总法律顾问(GC)和我们的谈谈吗?』他们遇到的阻力,我们从未体会过。
Farhan Thawar 法尔汉·塔瓦尔 Shopify 工程副总裁兼负责人
策略二:AI 工具的预算「上不封顶」
要实现 AI 的全面普及,成本是无法回避的问题。随着 Cursor 在公司内部的广泛使用,一些人开始担心费用会失控。但这恰恰与 Thawar 的初衷相反:他希望只要工具能创造价值,人人都能毫无顾忌地使用。
Thawar 通过一个内部排行榜观察,谁为 Cursor 的 tokens 支付额外费用最多。「我们不设额度限制。我也不希望有人用脚本刷榜,但它确实是一个衡量价值的绝佳指标。我们不希望员工在使用 AI 或最新模型时有任何顾虑,」 Thawar 说。「我认识一些人,他们因为用 AI 完成了重要工作而荣登 token 消费榜前十,并以此为傲。」 Shopify 的首席技术官 Mikhail Parakhin 最近也名列其中。
「我和许多 CTO、CEO 交流时,发现一个令人忧虑的趋势:他们过分纠结于 token 的成本,」 Thawar 说,「他们会盘算:『工程师们使用 Cursor、Windsurf、GitHub Copilot 这类工具,每人每月要多花 1,000 到 10,000 美元,我负担得起吗?』于是他们选择收紧预算。」
这种思维方式与推广 AI 的目标相悖。
「如果你的工程师因为使用大语言模型(LLM)每月多花了 1,000 美元,但效率提升了 10%,那这笔投资简直太划算了。任何公司都会为这样『廉价』的效率提升而兴奋。」(Thawar 甚至表示,如果你的工程师每月能花掉 10,000 美元并创造价值,请务必私信他,他想学习经验。)
策略三:统一的 AI 入口与 MCPs

为了让员工能轻松地使用和构建最新的 AI 工具,Shopify 将所有资源整合到了一个平台:公司的内部 LLM Agent。这个 Agent 作为一个统一的入口,让用户能与各种模型无缝交互和切换。在生产环境中,该 Agent 还承担着扩展、追踪和故障转移等重要功能。
员工可以利用这个 LLM 构建自己的工作流,自由选择各种模型,并总能第一时间用上最新版本。平台内建了丰富的 MCPs 集合,用户只需向 Agent 或 Cursor 等工具发出请求即可调用。这里甚至还有一个由同事们创建好的 Agent库,供所有人取用。它是一个一站式的 AI 工作站,满足了员工的所有需求。

「MCP 服务器是连接公司所有内部工具的重要基础设施层。我们的理念是『万物皆可 MCP』,」 Thawar 说。「我们将公司内部的每一份数据,无论它存储在哪个工具里,都通过 MCP 变得触手可及,方便员工随时调用,构建自己的工作流。」
02
基于 AI 的工作流案例
让 AI 更多地展示思考过程,
而不是隐藏
许多人的担忧是,过度依赖 AI 会让我们「大脑生锈」,与工作本身产生疏离感。但一个反直觉的事实是,如果使用得当,AI 反而能向你更多细节,让你更深入地参与其中。
「大多数人认为,理想的用户体验就是你提问,AI 给答案,中间的『混乱』过程越少越好,」 Thawar 说。「但如果你的目标是帮助人们精通某项技能,那么展示这些过程细节反而效果更佳。」

策略:对人进行「情境工程」
Shopify 认识到,要有效地驱动 AI 的应用,关键不仅在于优化提示词,更在于将「情境工程」 (context engineering) 理念,系统化地应用在员工身上。
举个例子:在 Shopify,项目负责人每周都需要提交项目进展报告,这使得公司的项目管理系统成了一条信息高速公路。现在,一个 AI agent 会自动抓取与项目相关的 GitHub 拉取请求、文档、评论以及 Slack 频道信息,并撰写周报初稿。
每周五,项目负责人会收到这份 AI 生成的报告,但附带了一系列挑战性的追问,比如「本周你具体完成了哪些工作?」. 这促使负责人必须批判性地审视 AI 的总结,并对其进行优化。他们被激励去发现其中与实际情况不符之处,暴露潜在的风险,而不是草草接受完成情况,因为他们希望自己的工作成果能被准确地理解。
「根据负责人的反馈,AI 会生成一份新的报告。我们会对比最终版本与初稿的差异,AI 则根据这些重写内容进行学习,不断进化,」 Thawar 说。过去,撰写周报需要耗费大量时间搜集信息,而现在,项目负责人可以将精力集中在人类最擅长也最应该做的事情上:批判性地思考和挑战,从而让工作成果变得更好。

我们发现,由 AI 生成的周报初稿,有一半都无需修改直接通过了。这些报告质量很高,部分原因在于 AI 整合了它能获取到的所有相关信息。
Farhan Thawar 法尔汉·塔瓦尔 Shopify 工程副总裁兼负责人
工作流:「吐槽」代码的 Roast 框架
Shopify 运行着全球规模最大的 Ruby on Rails 应用之一。如何让大量工程师高效地协作,共同维护这样一个庞大的单一代码库,始终是一项挑战。尤其是在 Ruby 这种推崇「约定优于配置」,鼓励开发者个人自由发挥的语言环境中。
Shopify 的工程师们发现,AI 可以成为维护代码约定、统一单元测试和代码更新规范的强大工具。但 AI 本身并不可靠,它需要明确的结构化引导,并与确定性的工具和原则相结合。
于是,Shopify 开发了 Roast,一个用于代码检查、修复和迭代的开源 AI 编排框架。它的名字源于公司内部一个同名的 AI 工具,该工具以「吐槽」(roast) 的方式对现有代码和单元测试提出建设性的批评和改进建议。Roast 并不是一个必须做所有事情的单一提示,而是让开发者可以设计并运行由一系列小而精准、成功率高的步骤组成的反馈循环:
-
Roast 将工作流拆解成多个步骤,并在每一步都清晰地展示 AI 的推理过程。
-
这些步骤共同构成了一段完整的对话历史,方便工程师追溯 AI 的决策逻辑。
-
其核心的 CodeAgent(基于 Claude Code 构建)会总结自己的每一步操作及其原因。
-
在进行测试评分等任务时,Roast 会就得分高低给出详尽的反馈,在呈现最终结果前,先解释「为什么」和「怎么样」。
「将确定性工具与 AI 工具结合,它们可以互相补充信息,并弥补差距,」 参与开发 Roast 的 Shopify 员工开发者 Samuel Schmidt 说道。Roast 简化了 agent 的使用,并向与之协作的工程师展示其工作全过程,使得以可重复、可扩展的方式执行复杂流程变得更加容易。
这款工具已经为 Shopify 内部解决了许多技术难题,比如帮助工程师分析数千个测试文件,自动修复常见问题,从而全面提升了代码的测试覆盖率。在解决这些问题的过程中,团队也摸索出了一套更可靠地利用 AI 完成复杂工程任务的新范式,这也是许多团队当前面临的挑战。因此,Shopify 决定将 Roast 开源,邀请整个社区共同塑造 AI 辅助任务执行的未来。
04
在产品开发中建立「初学者心态」
Shopify 不仅在增加初学者的数量,也在改变产品开发流程,更加强调原型制作,这是一种将自己置于初学者心态的实践。他们认为,这才是突破瓶颈、找到解决方案的真正关键。

策略:雇佣更多的初级人才
在人才策略上,Shopify 有意转变了思路,没有停留在「AI 将取代人力」这种简单的表面理解上,而是建立了一条新原则:「如果你能利用 AI 创造出卓越价值,公司就会投入更多资源来支持你」,而这些资源其中就包括新的人手。
传统观点认为,AI 将会摧毁入门级岗位,工程专业的毕业生普遍有种「末日将至」的感觉,担心毕业即失业。但 Shopify 相反,雇佣了更多的实习生。因为他们发现,这些年轻人恰恰是以最富创造力的方式使用 AI 的群体,他们天生就具备初学者心态。
在成功引入 25 名工程实习生后,Lütke 问 Thawar 这个项目最大能扩展到什么规模。「我最初的回答是,在现有基础设施下,可以支持 75 人。但后来我收回了这句话,将答案更新为 1,000 人,」 Thawar 说。
Thawar 有着丰富的实习项目管理经验。他深知,实习生能为团队带来活力、激情和冲劲。而在后 LLM 时代,他们还带来了一项新技能:他们是天生的「AI 半人马」。「他们总是对新工具和捷径充满好奇。我希望他们能『偷懒』,去使用最新的工具,」他说。「我们在移动互联网时代就见证过这一点。当时我雇佣了大量实习生,因为我知道他们是『移动原住民』。」

策略:用更多原型,探寻最佳路径

现在,更多的原型制作在 Shopify 的产品开发流程中占据了更核心的位置。具体来说,公司着力于提升原型尝试与最终构建之间的比例。这践行了 Shopify 的一项核心原则,即「产品开发的绿色通道」:解决一个复杂问题的唯一方法,就是不断地尝试。Lütke 曾对 Thawar 说:「一个问题有无数种糟糕的解法,和大概一万种不错的解法。你的任务是在那一万种里找到最优解。你刚才展示的只是第一个跑通的方案,而不是最好的方案。你为什么就停下了?」
Thawar 补充道:「你面对的是一个包含上百个变量和层级的问题,你必须探索不同的路径。这些路径也许会导向外观相似的最终产品,但其背后的权衡与取舍却可能天差地别。」
例如,Shopify 内部的 AI 聊天工具就源于一个原型。高级工程师 Matt Burnett 最初只是为了改善内部对 LLM 的访问,用开源工具做了一些实验。他在早期版本中不断迭代,解决了数据丢失和扩展性等问题,并通过让同事尽早试用,暴露了架构上的缺陷。最终,这款工具被广泛采用,以至于公司成立了一个专门的工程团队来负责运营。
AI 使用程度与绩效紧密「挂钩」
为了衡量整个组织工程效率的各个维度,Thawar 使用了一个工程活动仪表盘。它追踪谁在进行结对编程,谁参与了面试,以及前边所提到的,谁在使用 Copilot。
Shopify 多年的数据显示,结对编程能显著提升学习速度。利用这个仪表盘,公司进行了一项分析,考察了结对编程时长与绩效评估结果之间的关系。结果表明,工程师的结对编程时间越长,其影响力就越大;反之则越小。
现在,这个仪表盘也开始追踪员工对 Cursor、Claude Code 和 LLM 代理等 AI 工具的使用情况。一项初步分析显示,使用这些工具的员工,其影响力也呈现出正相关性。这有助于识别真正能创造价值的工具,并它们与个人绩效之间的联系。
Shopify 已经将 AI 相关的问题纳入了 360 度评估体系。经理和同事需要评价彼此在「AI 原生」或「AI 反射性」方面的表现。公司计划在积累几年数据后,对 AI 使用与个人影响力之间的关系做更深入的分析。
Thawar 自己也身体力行,通过结对编程来示范如何使用 AI。「我和一位工程师结对编程,一方面是想观察他解决问题的方法,另一方面也是为了推行我的理念。我总是开着一个 ChatGPT 的标签页,在实践中向他展示我是如何无时无刻地与 AI 协作的。」
05
效率提升会重塑工作流程
如果你能精密分析职业运动队训练或米其林星级餐厅后厨运作的每一个动作,你会发现他们的运动效率高达 80% 左右。再反观一家企业,其运营效率最多可能只有 20%。
「企业中存在着难以想象的浪费,仅仅是因为我们还没有发现做事的最佳模式。」 Thawar 指出。「AI 能加速现有流程,这一点显而易见。但更深层次、更不为人所知的价值在于,它能让你猛然发现,你的流程或许应该以完全不同的顺序、基于完全不同的假设来执行。当那个『顿悟』时刻来临时,或许能跳过大量的冗余工作,或是重塑整个流程。」
再想想那个网站审计工具。Thawar 思考着它如何能彻底改变销售流程。「当制作一份网站审计报告的成本变得微不足道时,你可能会改变销售流程中由谁、在何时来呈现这些数据。比如,你可以在销售漏斗的更早期就引入它,而不必等到客户被高度筛选后。这样,销售开发代表(SDRs)接触的客户类型可能都会改变,」他说。「这最终会催生一个全新的销售流程。而这一切的唯一驱动因素,就是我们能以极低的成本生成网站审计报告。」
他以备受推崇但又极难复制的「丰田生产体系」为例。AI 或许正在改变这一切。「AI 从根本上改变了我们的基本假设。你可以用它来破解生产线中复杂的组合问题,将效率提升一千倍。这才是真正的魔力所在。我们追求的,正是发现这种『流程的力量』。」

CEO 复盘:从每月亏损 260 万美元到实现盈利,Medium 如何「断臂求生」?
万字对谈 Physical Intelligence(π):具身智能的卡点和下一步突破,到底在哪?
Manus 有什么不一样?” data-itemshowtype=”0″ linktype=”text” data-linktype=”2″>ChatGPT Agent 团队专访:基模公司做通用 Agent,和 Manus 有什么不一样?
转载原创文章请添加微信:founderparker