

【编者按】在人工智能浪潮席卷全球的当下,科技巨头们正以前所未有的速度拥抱变革。然而,当AI的触角深入核心业务系统,效率提升的背后是否潜藏着新的风险?亚马逊近期接连遭遇的服务中断事件,为我们敲响了一记警钟。从购物车失灵到账户无法访问,这些看似技术性的故障,实则揭示了AI辅助开发在落地过程中的阵痛——当生成式AI工具开始参与关键生产环境的代码变更,传统安全边界正面临重构。本文将深入解析亚马逊如何在这场技术风暴中紧急转向,在追求创新与确保系统稳定之间寻找平衡。这不仅是亚马逊的必修课,更是所有数字化转型中企业必须直面的时代命题。
据CNBC证实,亚马逊计划在周二的零售技术会议上,着手解决近期一连串服务中断问题,其中部分故障与AI辅助编码错误有关。
负责亚马逊网站技术基础架构的高级执行官戴夫·特雷德韦尔向员工透露,公司的“本周零售技术”会议将“深入剖析导致当前状况的若干问题”。会议定于美国东部时间下午12:30开始。
“各位同仁——想必大家已经注意到,近期网站及相关基础设施的可用性表现不佳,”电子商务基础架构高级副总裁特雷德韦尔在给员工的内部备忘录中写道。他补充说,鉴于“Sev 1级事件”(指导致关键系统中断或性能严重下降的高危事故)频发,他将调整本次会议的重点。
特雷德韦尔指出,亚马逊在一周内经历了四起此类事故,并强调必须通过深度复盘“重拾我们强大的可用性态势”。
《金融时报》率先报道了相关备忘录内容。亚马逊发言人表示,“本周零售技术”是零售技术领导者每周例行评估店铺运营绩效的会议。
“作为常规业务的一部分,本次会议将包含对网站及应用程序可用性的复盘,这是我们持续改进工作的重要环节,”发言人在声明中称。
此次会议召开前夕,亚马逊线上商店上周曾出现部分用户无法访问的故障。上周四持续约六小时期间,网站和应用程序用户无法完成结算、查看账户信息或浏览商品价格。亚马逊在声明中表示,该问题与“软件代码部署”有关。
随着人工智能服务需求激增(这类服务需要持续增长的计算能力),亚马逊及其超大规模云服务竞争对手正在加大基础设施投入。在上月的财报中,亚马逊宣布今年资本支出预计达2000亿美元,远超其他科技同行。
在加大AI投入的同时,亚马逊仍在持续裁员。继去年10月裁减约1.4万个岗位后,该公司今年1月再度解雇约1.6万名企业员工。2022年至2023年间,亚马逊累计裁员超过2.7万人。
特雷德韦尔在另一份员工备忘录中写道,“生成式AI辅助的变更”是导致2025年第三季度以来多起事故的诱因之一。
根据CNBC查阅的备忘录,他特别指出“生成式AI工具补充或加速生产变更指令,导致不安全操作”等因素。特雷德韦尔同时承认,围绕生成式AI使用的“最佳实践与安全防护措施”尚未完全建立。
备忘录显示,亚马逊计划“强化”多项防护机制以防止问题重现,包括要求更资深工程师复核初级员工执行的“生成式AI辅助”生产变更。
“我们正在实施临时安全规范,针对零售体验最关键环节的变更引入受控约束机制,同时将投资构建更持久的解决方案,包括确定性防护与智能体防护双轨体系,”特雷德韦尔写道。
亚马逊云服务(AWS)近月亦遭遇多次中断,不过公司周二澄清特雷德韦尔提及的事故不涉及云业务部门。
据多方报道,AWS去年12月曾发生事故,导致成本管理功能长时间瘫痪。《金融时报》披露该问题源于工程师允许其Kiro AI编码工具执行变更操作。
亚马逊当时发布声明称,中断系“用户操作失误”所致,与AI技术无关。