
● LIVE
AI · GAME · E-COMMERCE
Human vs AI Judge
当 AI 已经做出判断,谁来按那个确认键?与 AI 同场竞技,对真实电商售后工单做意图分类,实时对比人类、Claude、GPT 三方判断差异。
嗨👋 欢迎来到 「许昆瑜」 的个人网页
Design Engineer · AI · E-commerce
在电商 SaaS 全链路做工程与体验的交付,用 AI 放大判断力,用数据校验直觉。
背景与方向
在 ThoughtWorks 做电商 SaaS 全链路前端工程,现参与跨团队 AI Playbook 的探索与撰写。
技术栈
有建筑学和 UX 的背景,转到前端之后发现这些经历带来了一种特别的视角——习惯从整体动线往下看,而不是从单个功能往上建。这让我更容易在需求还没清晰的时候就注意到链路里的断点,比起等问题暴露,更想在上游就把它找出来。
这个视角来自动线思维——理解用户在哪里卡住,比理解他们「想要什么」更接近问题的根。
在工程和体验的交叉点工作,一直觉得「能不能交付」和「值不值得交付」同样重要。AI 的出现让这件事变得更有意思——不只是把开发提速,更像是一个重新审视交付方式本身的机会。
现在把这些拆成文章和 demo,系统验证 AI 在电商 SaaS 每一层的真实介入价值。
探索方向
工作经历
软件开发工程师
作为项目前端主力成员,深度参与了微前端购买流程重构(Module Federation)与 SPA 购买体验优化,技术上做过性能调优、新国家 rollout 的 config 配置、微前端跳转重定位这些前端专项工作。一直在探索怎么把 AI 真正用进交付节奏里——AI 辅助 UI 需求快速变更上线、Figma API 驱动的 i18n 自动化方案、Figma MCP 生成 UI 组件框架,一步一步把「AI 加速开发」从概念变成团队可复用的实践。
业务侧有机会以 feature owner 身份完整主导过几个用户体验向的小功能,从技术方案到埋点设计、再到生产部署全程跟完。团队层面在推动生产 support 流程的梳理与 AI 辅助排障的落地,也参与了跨团队 AI Playbook 的探索和撰写——交付功能是基线,也想让团队整体的工作方式变得更好一点。
精选项目与实验

● LIVE
AI · GAME · E-COMMERCE
当 AI 已经做出判断,谁来按那个确认键?与 AI 同场竞技,对真实电商售后工单做意图分类,实时对比人类、Claude、GPT 三方判断差异。

◆ HACKATHON ★ TOP 10
UX DESIGN · E-COMMERCE · MOBILE
UXcel × UX Pilot 竞赛 Top 10 获奖作品。以「无感购物」为核心,11 个页面覆盖完整电商链路——极简留白、卡片式信息架构、透明结算流程。用 AI 辅助完成从线框到高保真的全流程。

◆ HACKATHON
AI AGENT · GITLAB HACKATHON
GitLab AI Hackathon 参赛项目。以「规格鸿沟」为切入点——业务逻辑在产品、设计、开发之间反复翻译导致的失真。用单一 spec 数据源驱动 AI 自动生成代码、测试与文档。

● LIVE
AI AGENT · E-COMMERCE
筛选器解决不了的问题,Agent 从这里开始。用 Claude API + tool calling 构建的 AI 导购 agent,演示自然语言意图理解如何替代传统多级筛选。

● LIVE
CHECKOUT · STRIPE
完整电商购物流程实验场,Stripe Checkout 集成,覆盖从商品列表到支付完成的全链路。

● LIVE
AI · GAME · E-COMMERCE
当 AI 已经做出判断,谁来按那个确认键?与 AI 同场竞技,对真实电商售后工单做意图分类,实时对比人类、Claude、GPT 三方判断差异。

◆ HACKATHON ★ TOP 10
UX DESIGN · E-COMMERCE · MOBILE
UXcel × UX Pilot 竞赛 Top 10 获奖作品。以「无感购物」为核心,11 个页面覆盖完整电商链路——极简留白、卡片式信息架构、透明结算流程。用 AI 辅助完成从线框到高保真的全流程。

◆ HACKATHON
AI AGENT · GITLAB HACKATHON
GitLab AI Hackathon 参赛项目。以「规格鸿沟」为切入点——业务逻辑在产品、设计、开发之间反复翻译导致的失真。用单一 spec 数据源驱动 AI 自动生成代码、测试与文档。

● LIVE
AI AGENT · E-COMMERCE
筛选器解决不了的问题,Agent 从这里开始。用 Claude API + tool calling 构建的 AI 导购 agent,演示自然语言意图理解如何替代传统多级筛选。

● LIVE
CHECKOUT · STRIPE
完整电商购物流程实验场,Stripe Checkout 集成,覆盖从商品列表到支付完成的全链路。

● LIVE
AI · GAME · E-COMMERCE
当 AI 已经做出判断,谁来按那个确认键?与 AI 同场竞技,对真实电商售后工单做意图分类,实时对比人类、Claude、GPT 三方判断差异。
精选文章与笔记

微前端跳转后滚动复原,不是一个 scrollTo 能解决的。状态要活过跳转、元素要出现在 DOM、还要等渲染真正完成——三件事都得在浏览器渲染管线的正确时机触发。「元素在 DOM 里」和「元素画好了」是两个不同的问题,用错 API 就会踩坑。

做了一张微前端技术卡,AI 给的代码能跑,但一直有个元素找不到。loop 了三四次才意识到:不是 AI 不行,是我从没给过它业务之下那一层的信息。这篇是对这次 pair coding 的复盘,也是对 AI 协作模式的一次重新想。

假期逛精品小店,遇到喜欢的东西直接拿下,完全不费力气。但同样的商品放到网上,打开页面却感觉脑袋嗡嗡的——分类、筛选、产品卡片铺天盖地,反而不知道从哪里看起。同样是挑东西,为什么体验差这么多?这篇文章从这个问题出发,聊聊电商独立站的信息架构设计,以及「好逛」和「好找」背后那个很少被说清楚的取舍。

不是排名低,是页面对 Google 完全不存在。这篇记录了一次微前端项目的完整 SEO 排查过程,以及从中整理出的四层诊断框架:链接发现、可访问性、内容渲染、语义理解。断点找错了层,改再多也没用。

用纺织工厂改造比喻 Agent 系统的演进——V1 结构化执行,V2 规划反思,V3 记忆管理,V4 安全护栏。能力越强,需要的约束越精密。工程化的关键不在 AI 本身,而在于通过流程设计与安全防护让复杂系统在生产环境里稳定运作。

Headless 架构的本质是「只暴露能力接口,不预设 UI 形态」。AI Agent 作为新型消费方,恰好不需要 UI——这让 Headless 成为最易被 AI 接手的系统形态。但 API 设计与治理成本并没有因此消失。