Skip to content

Latest commit

 

History

History
150 lines (111 loc) · 4.19 KB

File metadata and controls

150 lines (111 loc) · 4.19 KB

Mobile Use - 面向AI时代的移动端 Infra 到 Agent 全链路解决方案

English | 简体中文

🚀 产品概述

Mobile Use 解决方案介绍文档

Mobile Use 是基于 火山引擎云手机豆包视觉大模型 能力,通过自然语言指令完成面向移动端场景自动化任务的 AI Agent 解决方案。

目前,Mobile Use 已正式上线火山引擎 函数服务 veFaaS 应用广场,可点击跳转在线体验 Mobile Use Agent Demo;同时,如果您想要开发一款属于您自己的 Mobile Use Agent 应用,可以通过 一键部署,快速完成服务部署搭建,开启您将 Mobile Use Agent 集成在您业务流中的开发之旅。

✨ 核心特性

  • AI自动化:基于豆包视觉大模型进行移动端应用与复杂场景精确识别理解与点击
  • 云手机:安全、稳定、低延时的云手机隔离环境中执行自动化任务
  • MCP协议支持:支持标准模型上下文协议(MCP)的 Mobile Use MCP 工具
  • Web界面:现代化React/Next.js网页界面用于交互和监控
  • 实时流式处理:基于SSE的实时通信和反馈
  • 可扩展架构:模块化设计,易于扩展和集成进业务实际流程

🏗️ 系统架构

项目由三个主要组件构成:

mobile-use/
├── mobile_agent/      # Python AI Agent 核心
├── mobile_use_mcp/    # Go MCP 服务器
└── web/              # Next.js Web 前端

核心组件

  1. Mobile Agent (Python)

    • AI推理和决策制定
    • 视觉模型集成
    • 任务编排和执行
    • 记忆和上下文管理
  2. MCP Server (Go)

    • 云手机交互层
    • 标准MCP协议实现
    • 移动自动化工具和API
  3. Web Frontend (Next.js)

    • 用户界面和交互
    • 实时监控和反馈
    • 任务管理和可视化

🛠️ 可用工具

工具 描述
take_screenshot 截取云手机屏幕
tap 在指定坐标点击
swipe 执行滑动手势
text_input 在屏幕输入文本
home 回到主屏幕
back 返回到上一页
menu 打开菜单
autoinstall_app 自动下载和安装应用
launch_app 启动应用
close_app 关闭应用
list_apps 列出所有已安装应用

🚦 快速开始

环境要求

  • Node.js >= 20 (推荐使用 nvm 进行版本管理)
  • Python >= 3.11 (推荐使用 uv 进行依赖管理)
  • Go >= 1.23 (用于MCP服务器)
  • 火山引擎云手机访问权限和凭证

Warning

操作系统要求: MCP服务器目前仅支持Linux系统构建

安装步骤

  1. 克隆仓库
git clone https://github.com/volcengine/ai-app-lab.git
cd demohouse/mobile-use
  1. 安装依赖
sh setup.sh
  1. 配置环境
# 复制并编辑配置文件
cp mobile_agent/.env.example mobile_agent/.env
cp web/.env.example web/.env
# 使用你的API密钥和端点编辑配置
  • agent 配置说明
MOBILE_USE_MCP_URL= # MCP_Streamable 服务地址 http://xxxx.com/mcp

TOS_BUCKET= # 火山引擎对象存储桶
TOS_REGION= # 火山引擎对象存储区域
TOS_ENDPOINT= # 火山引擎对象存储终端

ARK_API_KEY= # 火山引擎方舟平台API密钥
ARK_MODEL_ID= # 火山引擎方舟平台模型ID

ACEP_AK= # 火山引擎云手机 AK
ACEP_SK= # 火山引擎云手机 SK
ACEP_ACCOUNT_ID= # 火山引擎账号ID
  • web config
CLOUD_AGENT_BASE_URL= # agent 服务地址
  1. 启动服务

启动MCP服务:

cd mobile_use_mcp
go run cmd/mobile_use_mcp/main.go  -t streamable-http -p 8888

启动 mobile agent 服务:

cd mobile_agent
uv venv
source .venv/bin/activate
uv pip install -e .
uv run main.py

启动Web前端:

cd web
npm run dev
  1. 访问应用

在浏览器中访问 http://localhost:8080?token=123