iPhone 上怎么运行 Gemma 4？

在 App Store 搜索并下载 Google AI Edge Gallery，打开后点击 Agent Skills，下载 Gemma-4-E2B-it 模型（约 2.54GB），下载完成即可离线使用，支持中文对话。

Google AI Edge Gallery 支持哪些功能？

支持 AI Chat（多轮对话）、Agent Skills（工具调用）、Ask Image（图片问答）、Audio Scribe（语音转文字）和 Prompt Lab（参数调试），所有功能均在设备端完成，无需联网。

昨天刚写完 Gemma 4 开源发布，今天就有人问我：这东西能在 iPhone 上跑吗？

能。而且简单到离谱。

App Store 搜索「Google AI Edge Gallery」→ 下载 → 打开 → 点 Agent Skills → 下载模型 → 完事。 三分钟，不需要科学上网，不需要 API Key，不需要配任何环境。

端侧大模型不再是 PPT 上的概念。Gemma 4 跑在 iPhone 上，完全离线，支持中文，带工具调用——这件事今天每个人都能做到。彻底变天了。

iPhone 运行 Gemma 4：端侧 AI 彻底变天

先说结论——这是我见过门槛最低的大模型体验方式，没有之一。

步骤	操作	耗时
1	App Store 搜索「Google AI Edge Gallery」，下载安装	30 秒
2	打开 App，点击「Agent Skills」	5 秒
3	选择 Gemma-4-E2B-it，点击下载（约 2.54GB）	2-3 分钟

实际操作截图：Google AI Edge Gallery 界面、Agent Skills 模型选择与初始化

下载完就能用。没有注册、没有登录、没有 Token 额度限制。 模型跑在你手机的芯片上，数据不出设备，完全离线工作。

对比一下传统方式：

以前想体验大模型，门槛是技术；现在门槛只剩一个——你的 iPhone 储存空间够不够放 3GB 模型。

三步上手：从下载到对话的完整流程

大多数人用大模型就是「聊天」。但 Google AI Edge Gallery 的核心功能不是 AI Chat——是 Agent Skills。

什么意思？模型不只是回答你的问题，它还能主动调用工具帮你做事。

重点说 Agent Skills。它让手机上的模型第一次具备了「行动能力」——不只是生成文本，而是能像一个助手一样操作工具、查询信息、组合行动。

举个例子：你问它「上海明天天气怎么样」，传统聊天模型只能瞎编一个答案。但带 Agent Skills 的 Gemma 4，可以调用工具去查真实数据，再把结果整理给你。

社区还在 GitHub Discussions 上分享自定义 Skill，你甚至可以通过 URL 加载第三方 Skill。这不是一个聊天 App——这是一个可扩展的端侧 AI Agent 平台。

当模型跑在手机上，还能调工具、查信息、做决策——「AI Agent」就不再是需要服务器支撑的概念了。它已经装进了你的口袋。

Agent Skills：端侧 AI 的工具调用能力

很多人对端侧模型的印象还停留在「英文还行，中文拉胯」。

实测结论：Gemma-4-E2B-it 的中文能力完全可用。 日常对话、知识问答、文本摘要、简单推理——表现超出预期。

当然，E2B 毕竟是等效 2B 参数的轻量模型，复杂数学推理和长篇代码生成不是它的强项。 但作为一个跑在手机上的离线助手，它的性价比无敌：

另一个让我惊喜的功能是 Thinking Mode。 打开后，模型会展示逐步推理过程——你能看到它是怎么「想」的。这不只是一个 debug 工具，更是理解 AI 推理逻辑的窗口。

还有 Ask Image 功能：对着一张菜单拍照，模型直接告诉你每道菜是什么、大概多少钱。在手机上，离线状态下。

端侧模型的中文能力已经跨过了「能用」的门槛。对于不想按 Token 付费、不想数据上云的用户来说，这就是最好的选择。

中文实测：端侧 Gemma 4 的真实表现

谷歌做这件事的意图很清楚——把 AI 的入口从云端拉回设备端。