English | 简体中文
Mobile Use 是基于 火山引擎云手机 与 豆包视觉大模型 能力,通过自然语言指令完成面向移动端场景自动化任务的 AI Agent 解决方案。
目前,Mobile Use 已正式上线火山引擎 函数服务 veFaaS 应用广场,可点击跳转在线体验 Mobile Use Agent Demo;同时,如果您想要开发一款属于您自己的 Mobile Use Agent 应用,可以通过 一键部署,快速完成服务部署搭建,开启您将 Mobile Use Agent 集成在您业务流中的开发之旅。
- AI自动化:基于豆包视觉大模型进行移动端应用与复杂场景精确识别理解与点击
- 云手机:安全、稳定、低延时的云手机隔离环境中执行自动化任务
- MCP协议支持:支持标准模型上下文协议(MCP)的 Mobile Use MCP 工具
- Web界面:现代化React/Next.js网页界面用于交互和监控
- 实时流式处理:基于SSE的实时通信和反馈
- 可扩展架构:模块化设计,易于扩展和集成进业务实际流程
项目由三个主要组件构成:
mobile-use/
├── mobile_agent/ # Python AI Agent 核心
├── mobile_use_mcp/ # Go MCP 服务器
└── web/ # Next.js Web 前端
-
Mobile Agent (Python)
- AI推理和决策制定
- 视觉模型集成
- 任务编排和执行
- 记忆和上下文管理
-
MCP Server (Go)
- 云手机交互层
- 标准MCP协议实现
- 移动自动化工具和API
-
Web Frontend (Next.js)
- 用户界面和交互
- 实时监控和反馈
- 任务管理和可视化
| 工具 | 描述 |
|---|---|
take_screenshot |
截取云手机屏幕 |
tap |
在指定坐标点击 |
swipe |
执行滑动手势 |
text_input |
在屏幕输入文本 |
home |
回到主屏幕 |
back |
返回到上一页 |
menu |
打开菜单 |
autoinstall_app |
自动下载和安装应用 |
launch_app |
启动应用 |
close_app |
关闭应用 |
list_apps |
列出所有已安装应用 |
- Node.js >= 20 (推荐使用 nvm 进行版本管理)
- Python >= 3.11 (推荐使用 uv 进行依赖管理)
- Go >= 1.23 (用于MCP服务器)
- 火山引擎云手机访问权限和凭证
Warning
操作系统要求: MCP服务器目前仅支持Linux系统构建
- 克隆仓库
git clone https://github.com/volcengine/ai-app-lab.git
cd demohouse/mobile-use- 安装依赖
sh setup.sh- 配置环境
# 复制并编辑配置文件
cp mobile_agent/.env.example mobile_agent/.env
cp web/.env.example web/.env
# 使用你的API密钥和端点编辑配置- agent 配置说明
MOBILE_USE_MCP_URL= # MCP_Streamable 服务地址 http://xxxx.com/mcp
TOS_BUCKET= # 火山引擎对象存储桶
TOS_REGION= # 火山引擎对象存储区域
TOS_ENDPOINT= # 火山引擎对象存储终端
ARK_API_KEY= # 火山引擎方舟平台API密钥
ARK_MODEL_ID= # 火山引擎方舟平台模型ID
ACEP_AK= # 火山引擎云手机 AK
ACEP_SK= # 火山引擎云手机 SK
ACEP_ACCOUNT_ID= # 火山引擎账号ID- web config
CLOUD_AGENT_BASE_URL= # agent 服务地址- 启动服务
启动MCP服务:
cd mobile_use_mcp
go run cmd/mobile_use_mcp/main.go -t streamable-http -p 8888启动 mobile agent 服务:
cd mobile_agent
uv venv
source .venv/bin/activate
uv pip install -e .
uv run main.py启动Web前端:
cd web
npm run dev- 访问应用
在浏览器中访问 http://localhost:8080?token=123