現在的 AI 工具能否解決這個困難呢? ChatGPT 與 Gemini 都無法提供,但是竟然 Manus 提供了。
ChatGPT 網址 https://chatgpt.com/
Gemini 網址 https://gemini.google.com/
Manus 網址 https://manus.im/app
我們向 ChatGPT 詢問 : 「能否在此練習MySQL?」 獲得以下的答覆 :
ChatGPT答覆說可以一起練習,但這個對話環境無法直接啟動 MySQL 伺服器來「真的」執行 SQL指令。
再向 Gemini 詢問 : 「能否在此練習MySQL?」獲得以下的答覆 :
但是向 Manus 詢問 : 「能否在此練習MySQL?」 獲得以下的答覆 :
Manus竟然說 : 「好的,我將為您準備一個可以練習 MySQL 的環境。」
這是真的還是假的? 我們繼續看下去。
我們要求建立一個資料表如下 :
CREATE TABLE customer (
customer_id INT PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(100) NOT NULL,
grade ENUM('A','B','C') NOT NULL,
created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP );
customer_id INT PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(100) NOT NULL,
grade ENUM('A','B','C') NOT NULL,
created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP );
我們從 Manus 的終端機看到如下畫面 :
我們試著插入資料,再來看看結果如下 :
除此之外,還能夠給予提示時,同時看到 Manus 的終端機執行的狀況如下 :
Manus 是一個通用的 AI 代理,他具有沙盒化虛擬環境 (Sandboxed Virtual Machine),是一個隔離且安全的虛擬電腦環境,可以執行使用者交付的任務。這個環境就像一台真實的電腦,擁有自己的作業系統 (Ubuntu Linux)、文件系統和網路連線,但與底層主機系統完全隔離。這確保了執行的任何程式碼或安裝的任何軟體都不會影響到外部系統,提供了高度的安全性與隱私保護。
當使用者需要使用 MySQL 時,Manus 可以在這個虛擬環境中透過 shell 命令列工具 (例如 apt-get) 來下載、安裝、設定並啟動 MySQL 伺服器。並且可以呼叫內建的工具來執行 Python 程式碼或 Shell 命令。這意味著 Manus 可以編寫並執行一個腳本來自動化整個 MySQL 的安裝與設定流程,而不需要手動一步步操作。
這篇文章"How Manus Uses E2B to Provide Agents With Virtual Computers"就提到了Manus的虛擬電腦,提到 Manus 並非單一代理,而是「規劃器 + 多個執行代理」的協作系統:規劃器把任務拆成子任務,再由執行代理透過瀏覽器、檔案系統、終端機等工具完成。為了讓代理像人類研究員一樣完成長流程任務,就需要一台完整的雲端電腦。
上面 Manus 執行我們給予的MySQL指令,就是在 Manus 的虛擬電腦中執行的。
Manus 自己也在這篇"介紹 Wide Research"說明了這個虛擬電腦 : 「傳統上,利用雲計算進行自定義工作流程一直是工程師和高級用戶的特權。在Manus,我們相信AI可以使這種能力民主化。每個Manus會話背後都運行著一個專用的基於雲的虛擬機,允許用戶通過與代理對話來編排複雜的雲工作負載。」
這篇2025/07/08的文章"Just now, OpenAI released its own Agent mode, Manus Style."也提到 OpenAI也推出類似 Manus 型態的 Agent mode。
文章提到「In OpenAI's introduction, the Agent mode can call three tools: the text browser, the visual browser, and the terminal. The model can independently choose to switch between various tools.」ChatGPT 的「Agent 模式(Agent mode)」可使用三種核心工具,並能自行在工具間切換與決策: 文字瀏覽器、視覺瀏覽器、終端機。
但是我們直接測試,OpenAI 的 agent mode 還是無法提供一個直接執行 MySQL 指令的環境。
ChatGPT 的解釋是 :
我無法直接「開一台真的 MySQL(MySQL)伺服器」給你下指令,主要是因為 Agent 模式(Agent mode)的「終端機(terminal)」與整個代理執行環境是被「沙盒(sandbox)」與「有限網路(limited network)」嚴格限制的——不能隨意啟動長駐背景服務(像 mysqld)、開放埠口給你連、或持久化儲存你的資料庫檔案。這是官方為了安全、隱私與濫用風險設計的邊界,而非技術上做不到。
解釋半天是說「安全、隱私與濫用風險設計的原因」,而不是技術問題。可以為何 Manus 可以提供呢? 因為 Manus 並非單一 LLM,而是規劃器+執行器的協作架構;執行器可以呼叫瀏覽器、檔案工具與終端機去做事,所以具備「裝環境→跑指令→產出成果」的能力。
這個差異代表的是「基礎設施與風險邊界的差異」,而不是單純「模型能力高低」。Manus 背後為代理臨時開一台可長時間運作的雲端虛擬電腦(VM),允許安裝軟體與啟動服務(如 MySQL);ChatGPT 的 Agent 模式目前採取更嚴格的安全沙盒與網路限制,雖可用「視覺瀏覽器/文字瀏覽器/終端機」完成大量工作,但不鼓勵直接在終端機開長駐服務。
不過為何 Manus 願意承擔濫用風險,也願意開放更大的網路功能呢? ChatGPT也不能用這些藉口而限制太多吧?
0 留言