一、autoMate是什么?
autoMate 是一个本地自动化 AI 工具,完全免费开源。不需要再在复杂的繁琐功能编码中打滚,在短短几句话之后就能教 autoMate 去执行你需要的任务:比如自动整理桌面上的文件,或者批量更改文件夹里面的图片名称,然后凭借先进的AI能力自己安排后续的工作流程并使用模拟鼠标键盘的方式完成整个任务——它支持对任何可视界面进行操作使用,并且是能实现本地化部署的好软件!目标是在简化各种单调乏味的工作时给你留下更多空闲时间来做更有意义的事情。
二、核心亮点
- 零门槛操作
- 我们甚至可以直接自然语言下命令来告别脚本、告别代码(比如把表格数据整理成报告),AI 直接执行。
- 支持本地化部署,数据隐私与安全性全面掌控。
- 全场景覆盖
- 界面操控:模拟人类操作任意可视化界面(Windows 应用、网页、文档、设计软件等)。
- 智能决策:OCR 识别 + 实时屏幕检测,解决繁琐复杂多变的任务逻辑(比如、异常等)判断。
- 多模态交互:无缝衔接文本、图像、文件等多类型输入输出。
- 高效性能
- 语义理解和任务规划能力强,基于 OpenAI 系列模型 (GPT-4o) 与国产适配模型。
- 本地 GPU 加速(推荐 NVIDIA 显卡)实现毫秒级响应,大幅提升自动化效率。
- 开放生态
- 支持 Plugin 扩展和自定义 API 接入,能够深入对接企业已有系统。
- 通过知识星球等社区持续迭代,邀请用户参与技术共创。
三、适用人群
- 普通用户:摆脱日常重复劳动(如文件整理、数据录入、跨平台操作)。
- 企业团队:快速实现业务流程自动化,降低人力成本。
- 开发者:通过开放接口打造个性化自动化解决方案。
四、技术架构
- OmniParser 核心:融合视觉感知、语义理解与决策引擎,实现端到端自动化。
- 轻量化设计:Python 3.12 + CUDA 环境,一键部署,资源占用极低。
- 模型兼容性:适配主流大模型(需中转工具如 Yeka),持续扩展国产化支持。
五、使用方法
- 环境准备:安装 miniConda,创建 Python 3.12 环境,克隆 GitHub 项目代码并安装依赖。
- 启动程序:直接运行下载好的可执行文件或使用源码(即输入命令行 python main.py 执行启动),端口访问 [http://localhost:7888/ 使用]。
- 配置密钥:在界面右上角设置中,输入 OpenAI API 密钥或 yeka 中转地址及密钥。
- 输入任务:将鼠标移动到主界面文本框里面,使用中文输入例如:“合并某个文件夹里面的 Excel 表格”。
- 执行监控:点击 “执行”,autoMate 解析任务并自动操作,完成后查看日志反馈结果。
- 进阶:复杂的动作分解开来;找不到界面就用“截图定位”来找;支持设置定时任务。
- 问题解决:不响应可以重启程序或者检查网络情况;执行出错看日志改一改;国内小伙伴使用推荐走 yeka 中转,防止 API 问题。