你的开源 AI 手机。
商业 AI 手机是黑箱。这个不是。

_{Open Cyber Jarvis}

--- ## 为什么当一家公司推出「AI 手机」，他们获得了你屏幕、应用、消息、银行账户的完整访问权——而你看不到运行的是什么模型，无法验证什么数据离开了设备，也无法选择替代方案。豆包 AI 手机？锁定字节跳动的模型。三星 Galaxy AI？锁定三星 + Google。Google 内置 AI？只有 Gemini。他们给你什么，你就用什么。 **你至少应该有选择的权利。** OpenCyvis 是开源替代方案：你能看到每一行代码，你来选 AI 模型，你决定数据去向。用本地模型时，任何数据都不会离开你的设备。 --- ## 它做什么 OpenCyvis 把任何兼容的 Android 设备变成 AI 手机。用自然语言给它一个任务——它看到你的屏幕，理解 UI，像你一样操作应用。 **"找附近评分最高的咖啡店，导航过去"** — 打开点评应用，搜索，按评分排序，点击第一个，开始导航。 **"查下周五去上海最便宜的直飞机票"** — 打开旅行应用，输入日期，筛选直飞，按价格排序。 **"设个早上 7 点的闹钟，打开勿扰模式，切换到暗色主题"** — 一口气串联时钟、设置、显示三个应用。

AI 设闹钟、开勿扰、切暗色主题 AI 在 Amazon 和 Walmart 比价 AirPods

_{左：三个任务一气呵成（闹钟 → 勿扰 → 暗色主题） | 右：跨 Amazon 和 Walmart 比价}

### 后台运行大多数 AI 工具在工作时会锁定你的屏幕。OpenCyvis 在**虚拟显示器**上运行——一个隔离的后台屏幕。AI 帮你订机票的同时，你照常刷微博。 ``` ┌─────────────────────┐ ┌─────────────────────┐ │ 你的屏幕 │ │ 虚拟显示器 │ │ │ │ (AI 在这里工作) │ │ 刷微博、聊微信、 │ │ │ │ 看视频—— │ │ 订机票、发消息、 │ │ 手机照常用 │ │ 下单购物 │ │ │ │ │ └─────────────────────┘ └─────────────────────┘ 你用这个 AI 用这个 ``` 随时观看 AI 工作。觉得不对就接管。处理完交还，AI 从中断处继续。

观看模式 — 实时查看 AI 虚拟显示器悬浮窗 — AI 在后台工作时桌面显示悬浮球

_{左：实时查看 AI 的虚拟显示器画面 | 右：AI 后台工作时桌面悬浮球}

--- ## 横向对比 | | 商业 AI 手机 | 云手机 | ADB 类智能体 | **OpenCyvis** | |---|:---:|:---:|:---:|:---:| | **开源** | ❌ | ❌ | ⚠️ | ✅ | | **自选 AI 模型** | ❌ | ❌ | ⚠️ | ✅ | | **数据留在设备** | ❌ | ❌ | ⚠️ | ✅ | | **AI 工作时手机照常用** | ⚠️ | ✅ | ❌ | ✅ | | **支持所有应用** | ⚠️ | ⚠️ | ⚠️ | ✅ | | **无需启动 ADB** | ⚠️ | ⚠️ | ❌ | ✅ | --- ## 功能 - **后台运行** — AI 在虚拟显示器上工作，你的手机照常用 - **任意 AI 模型** — Qwen、Claude、GPT、Llama、Gemma，或用 Ollama 本地运行 - **自然语言** — 用文字或语音描述你想做的事 - **视觉 + 结构化理解** — 同时读取截图和 UI 元素树 - **观看 & 接管** — 实时观察 AI 操作，随时接管，无缝交还 - **不确定时会问你** — 遇到歧义时暂停（"你说的'张伟'是哪个？有三个"），而非盲猜 - **安全防护** — 重复动作检测，敏感操作确认 - **离线语音** — 设备端语音识别（Sherpa-ONNX），无需联网 - **100% 开源** — 审计每一行代码 --- ## 支持的模型 OpenCyvis 不绑定模型。带上你自己的 API key，或运行本地模型——完全不联网。 | Provider | 示例 | 说明 | |:---|:---|:---| | **OpenAI 兼容** | Qwen、GPT | 默认 — 支持任何 OpenAI 兼容 API | | **Anthropic** | Claude Sonnet | 原生 Anthropic API | | **Ollama（本地）** | Gemma、Llama、Qwen | 设备端或自建服务器运行 — 数据不离开你的掌控 | ### 本地模型实测我们用 4 个真实 UI 场景（打开设置、拨号、处理不可能任务、查找联系人）测试了 6 个本地模型： | 模型 | 体积 | 速度 | 通过率 | |:---|:---:|:---:|:---:| | **Gemma 4 26B-A4B** Q4 | 17 GB | 63 tok/s | **4/4** | | **Gemma 4 E2B** Q4 | 1.8 GB | 41 tok/s | **4/4** | | **Gemma 4 31B** Q4 | 19 GB | 16 tok/s | 4/4 | | **Qwen 3.5 35B-A3B** Q4 | 22 GB | 47 tok/s | 3/4 | | **Gemma 4 E4B** Q4 | 3 GB | 61 tok/s | 3/4 | | **GUI-Owl 1.5 8B** Q4 | 5.4 GB | 75 tok/s | 2/4 | > **推荐：** Gemma 4 26B-A4B — 速度、质量、显存的最佳平衡。 > **极简：** Gemma 4 E2B — 仅 1.8 GB，依然通过全部 4 项测试。 --- ## 隐私 & 安全拥有完整手机访问权限的 AI 智能体，是你能运行的最高特权软件之一。这不是一个可以说「请相信我们」的地方。 - **截图和 UI 树仅存于内存** — 从不写入磁盘，从不存储 - **端点你来选** — 自建服务器、私有云或完全本地 - **无遥测、无分析、不偷偷联网** — 零追踪代码 - **开源** — 安全研究者、记者、任何人都能审计 - **本地模型选项** — 用 Ollama，数据不离开设备。句号。 ``` 你的屏幕 ──→ 截图（仅内存）──→ 你选择的 AI ──→ 执行操作 ↑ 这个端点由你掌控 ``` --- ## 快速开始 ### 前置条件 - AOSP 系统镜像 - 平台签名密钥（系统应用权限） OpenCyvis 是特权系统应用。它需要系统级权限来截屏和注入输入——无需 root hack 或无障碍服务变通。 ### 从源码编译 ```bash git clone https://github.com/opencyvis/opencyvis-phone.git cd opencyvis-phone/android ./gradlew assembleRelease ``` ### 部署到设备详见 [docs/aosp-deployment.md](docs/aosp-deployment.md)，包含 AOSP 兼容设备的符号链接配置、device makefile 和平台签名指南。 ### 没有设备？用模拟器尝鲜 ```bash ./scripts/deploy-emu.sh ``` ### 配置在应用内设置 LLM Provider，或通过 deeplink： ```bash # 本地 Ollama（完全私密，无需 API key） adb shell am start -a android.intent.action.VIEW \ -d "opencyvis://config?provider=ollama&base_url=http://localhost:11434&model=gemma4:26b" # 云端 API adb shell am start -a android.intent.action.VIEW \ -d "opencyvis://config?provider=openai&base_url=https://api.openai.com/v1&api_key=YOUR_KEY&model=qwen-vl-max" ``` --- ## 路线图 ### 下一步 - 更轻量的安装方式（无需刷机） - 跨设备协同（手机 + 桌面） ### 愿景 - AI 手机应该是公共基础设施，而非私有产品。我们的目标是建立开放的移动 AI 智能体标准，让每个人都能拥有、审计和掌控自己的 AI 助手。 --- ## 参与贡献详见 [CONTRIBUTING.md](CONTRIBUTING.md)。欢迎代码、Bug 报告、安全审计、翻译和文档贡献。 ## 许可证 [Apache 2.0](LICENSE) ## 致谢 - [Sherpa-ONNX](https://github.com/k2-fsa/sherpa-onnx) — 设备端语音识别 (Apache 2.0)