
DroidRun
DroidRun簡介
DroidRun是什么?
DroidRun 是一款可通過ai代理實現Android設備的自動化操作的開源工具。它結合視覺解析與 UI 結構提取技術,支持多種語言模型(如 OpenAI、Gemini 等),可自動執行任務、處理復雜界面和動態 UI。DroidRun 還具備智能錯誤處理、截圖分析能力、元素跟蹤等功能,適用于日常任務自動化、應用測試、數據提取等場景,支持 Android 6.0 及以上系統。
DroidRun核心功能
自然語言控制:用戶可以通過自然語言指令讓 AI 代理執行各種任務,例如打開應用、發送消息、瀏覽網頁等。
視覺與 UI 結構提取:結合視覺理解和 UI 結構提取技術,能夠準確識別屏幕上的按鈕、輸入框等交互元素,從而實現復雜界面的自動化操作。
智能錯誤處理:具備智能錯誤處理和自動恢復功能,能夠在遇到彈窗廣告、權限提示等意外情況時自動處理并繼續執行任務。
多語言模型支持:支持用戶連接自己偏好的語言模型,無需復雜的設置即可立即開始自動化操作。
DroidRun使用場景
日常任務自動化:用戶可以將重復性任務(如每日查看新聞、定時發送消息等)交給 AI 代理自動完成。
社交媒體管理:能夠批量處理社交媒體任務,例如自動登錄、上傳圖片、發布帖子等。
應用測試開發:開發者可以利用 DroidRun 模擬用戶操作,測試應用的界面和功能,記錄響應時間并發現潛在問題。
數據提取與分析:AI 可以自動從應用中提取數據,例如搜索附近餐廳并截圖。
DroidRun使用步驟
打開瀏覽器,訪問 DroidRun 官方網站。
在首頁點擊“Download Android Portal APK”下載 droidrun-portal.apk 文件(約 10MB)。
在 Android 設備上,進入“設置 > 安全”,啟用“未知來源”選項,允許安裝非官方應用。
使用文件管理器找到下載的 APK 文件并點擊安裝(安裝過程約需 1 分鐘)。
安裝完成后,首次打開 DroidRun Portal 應用時,應用會提示啟用“無障礙服務”和“屏幕截圖”權限。點擊提示進入設置頁面并啟用相關權限。
在應用內輸入語言模型的 API 密鑰(支持 Gemini、ChatGPT、Grok 等),點擊“Verify”確認連接成功。
github地址:https://github.com/droidrun/droidrun