做爬虫或者 AI Agent 的朋友,多少都被 Chrome Headless 折磨过。

脚本跑着跑着,服务器内存飙到 90%。想加并发,加不动。

更别提启动速度。每开一个实例,动辄等个几秒,积少成多就是好几分钟的空耗。

直到最近,我在 GitHub 上看到一个叫 Lightpanda 的项目,正好解决了这些问题。

这是一款用 Zig 语言从零写的 headless 浏览器,专门服务于 AI Agent 与自动化场景。

注意,是从零写。不是 Chromium,也不是 WebKit 打补丁,而是一个真正意义上的新浏览器。

作者团队的背景也挺硬核。之前在上家公司做爬虫,每天处理数百万级别的网页抓取,跟 Chrome Headless 死磕了好几年。

磕完之后得出的结论是,这事儿靠魔改 Chromium 走不通,必须推翻重来。

于是就有了 Lightpanda。

让我比较意外的,是它的 benchmark 数据。

在 AWS m5.large 上抓取 100 个真实网页,Headless Chrome 用了 46 秒,峰值内存 2GB。Lightpanda 只用了 5 秒,峰值内存 123MB。

速度快了约 9 倍,内存省了约 16 倍。

这组数字意味着,原本一台服务器只能跑 10 个并发,现在轻松跑上百个。爬虫成本和 Agent 成本直接打下来。

它能做到这点,是因为砍得够狠。

Lightpanda 直接把 CSS 布局引擎、图像解码器、GPU 合成器、字体光栅化、辅助功能树这些给机器用不到的模块,全部拿掉了。

留下的只有最核心的几件事。HTTP 加载用 libcurl,HTML 解析用 html5ever,DOM 树是纯 Zig 实现,JS 执行接 V8 引擎。

把浏览器里「给人看的部分」砍掉,只留下「给 AI 用的部分」。做减法,反而成了它最锋利的武器。

对开发者来说,最友好的一点,是它兼容 CDP 协议,也就是 Chrome DevTools Protocol。

原来写给 Puppeteer 或者 Playwright 的脚本,基本不用改,把 browserWSEndpoint 指向 Lightpanda 就能直接跑。

迁移成本非常低,这点对已经有存量脚本的团队非常友好。

除了 CDP,它还原生集成了 MCP 服务器。配置一下 commandargs,就能直接挂到 Claude Desktop、Gemini CLI 这类 MCP 客户端上使用。

对于正在搭 AI Agent 的朋友来说,这就是现成的浏览能力底座。

在安装上,Lightpanda 做得很轻。

Linux 用户一行 curl 搞定:

curl-L-o lightpanda https://github.com/lightpanda-io/browser/releases/download/nightly/lightpanda-x86_64-linux && chmod a+x ./lightpanda

macOS 用户把链接里的 x86_64-linux 换成 aarch64-macos 即可。

偏好容器的朋友,可以直接拉 Docker 镜像:

docker run -d--name lightpanda -p127.0.0.1:9222:9222 lightpanda/browser:nightly

Windows 用户稍微麻烦一点,目前没有原生 Windows 二进制,需要在 WSL 里跑。

另外还有两个小坑得提前说一下。

Linux 发行版如果是基于 musl 的(比如 Alpine),预编译包跑不起来。要么换成 Debian 或 Ubuntu 镜像,要么自己从源码编译。

还有一点需要打预防针,Lightpanda 目前仍在 Beta 阶段。Web API 覆盖度在持续补齐,遇到比较复杂的网站偶尔会崩。由于没有渲染引擎,不支持截图和 PDF 导出。

所以它的定位很清楚,做的是「AI 读取网页内容」这件事。抓数据、跑 AI Agent、做网页理解,它很合适。如果需要像素级渲染或者截图,那还是得留着 Chrome。

社区里目前的共识是,优先用 Lightpanda,跑不通再回退到 Chrome。

这个项目出现的时机其实很微妙。

浏览器这个赛道,正在悄悄分成两条路,一条给人用,一条给 AI 用。

过去大家都默认一件事,浏览器就该是 Chrome 那个样子。但 Chrome 的设计哲学是服务于人,几十年的代码沉淀里,绝大部分都在解决「视觉呈现」这个命题。

而 AI 不需要看,只需要读。

Lightpanda 做的事,正是顺着这条分岔,把浏览器的服务对象从人切到 AI。

当 Agent 真正成为主流使用者,更轻、更快、更省的底座,会慢慢变成刚需。

如果我们正在搭 AI Agent,或者运营着大规模爬虫任务,Lightpanda 很值得放进工具箱里试一试。

GitHub 项目地址:https://github.com/lightpanda-io/browser