最近許多朋友問我,在擁有效能強悍的 Mac Studio M2 Max 後,到底該如何打造最完美的本地端 AI 寫碼環境?很多人的第一直覺是安裝擁有華麗圖形化介面的 LM Studio,但經過實際的開發測試後,常常會發現它不僅佔用較多系統資源,有時候在 VS Code 的整合上更是頻頻卡關,什麼模型都裝不上去。如果你也遇到了這個痛點,請放心,這篇教學絕對是你的救星!我將手把手帶你捨棄臃腫的介面,無痛轉向極度輕量、穩定的 Ollama,並完美串接 Continue 擴充套件。我們將徹底發揮 M2 Max 龐大統一記憶體的優勢,為你解鎖超乎想像的本地端 AI 輔助開發體驗!
1. 為什麼專業開發者紛紛捨棄 LM Studio 轉投 Ollama?
許多人在剛接觸本地端 AI 時,會被 LM Studio 漂亮的操作介面吸引。這無可厚非,圖形化介面對於初學者來說確實降低了門檻。但當你真正進入日常的程式開發工作流時,LM Studio 這種基於 Electron 開發的桌面應用程式,其高昂的記憶體開銷與繁瑣的背景常駐邏輯,往往會成為拖累系統的包袱。
相比之下,Ollama 的設計哲學就如同 Unix 系統一樣優雅:它作為一個輕量級的背景守護行程(Daemon)默默運行,提供極致穩定的 REST API 介面。進入 2026 年,Ollama 更是深度原生整合了 Apple MLX 框架。特別是對於擁有 Mac Studio M2 Max 的你來說,這台機器的核心價值在於其架構獨步全球的「統一記憶體(Unified Memory)」。Ollama 能夠最直接、最高效地調用 Apple Silicon 的神經網路引擎(Neural Engine)與 GPU,不僅載入模型的速度飛快,在待機時幾乎不會消耗多餘的 CPU 資源。這也是為什麼當你想把 AI 當作 VS Code 裡不知疲倦的寫碼助理時,Ollama 絕對是你的不二之選。
2. 第一步:在 Mac 終端機一鍵就緒 Ollama 模型
要讓 Continue 能夠在 VS Code 裡面大展身手,我們得先為 Ollama 注入靈魂——也就是下載並啟動適合寫程式的語言模型。請打開你的 Mac 內建的「終端機(Terminal)」應用程式,這聽起來可能有點硬核,但實際上只需要一行指令。
進入 2026 年的開發圈,寫程式的霸主已經由新一代的 MoE 模型接手。我們現在就透過終端機把這個高智商的 AI 助理請到你的電腦裡,以 Qwen 3.6 為例:
當你按下 Enter 鍵後,系統就會開始自動下載模型的各個層級並驗證檔案。下載完成後,你會看到終端機出現了一個對話提示符號,你可以隨便跟它打個招呼測試一下。確認運作正常後,只需按下 Ctrl + D 即可退出對話。別擔心,Ollama 已經聰明地在背景啟動了本機伺服器(預設位址為 http://127.0.0.1:11434),隨時準備好接收 VS Code 的呼叫。
3. 第二步:深入 VS Code,完美修改 Continue YAML 設定檔
這是整個流程中最核心、但也最容易出錯的一步。許多人不知道如何正確地將 Continue 套件的大腦從 LM Studio 拔除並接上 Ollama。2026 年的 Continue 已經全面捨棄了舊版的 config.json,改用更強大的 config.yaml 來支援多 Agent 架構。
請依照以下步驟進行無縫切換:首先,在 VS Code 畫面左側的活動列中找到並點擊 Continue 的小圖示。接著,將視線移到 Continue 側邊面板的右下角,你會看到一個小巧的「齒輪圖示 (⚙️)」,毫不猶豫地點下去,VS Code 就會為你打開最新的 config.yaml 程式碼檔案。
在這個檔案中,尋找 models: 區塊。請將原本裡面所有關於 LM Studio 的設定果斷刪除(或用 # 註解隱藏起來),然後將以下這段為 Ollama 量身打造的 YAML 代碼貼上去:
這裡有一個非常重要的專業觀念要分享:為什麼我們設定了兩種模型?models 區塊負責的是你在對話框中問問題、請 AI 解釋程式碼時用的「邏輯大腦」;而 tabAutocompleteModel 則是負責在你打字時,神不知鬼不覺幫你補齊程式碼的「直覺小腦」。為了保證打字時的極致流暢度,強烈建議自動補全模型選用較小的參數版本(如 DeepSeek V4 Lite 7B)。修改完成後,請按下 Cmd + S 儲存檔案。現在,回到 Continue 面板,點選最下方的下拉選單,你就會發現 Ollama 已經傲然挺立在清單中了!
4. 第三步:突破極限!如何手動挖掘並加入隱藏版熱門 AI 模型
「可是,選單上沒有我想用的最新熱門模型怎麼辦?」這是許多剛切換過來的新手常有的疑問。請記住,Continue 的下拉選單只是一個「推薦快捷鍵」,Ollama 真正的威力在於它背後龐大且持續更新的開源模型生態圈。只要是開源界有的最新神器,你通通可以手動「點菜」!
你可以隨時前往 Ollama 官方模型庫 (Library) 尋寶。裡面有成千上萬的選項。假設你今天看新聞發現開發圈瘋傳的 DeepSeek V4 Flash 非常神,你只需要在官網找到它的名稱與參數標籤(Tags)。
接著,回到你的 Mac 終端機,像我們第一步做的那樣,輸入下載指令:
下載完畢後,AI 還不會自己跑到 VS Code 裡。你需要再次打開那個神奇的 config.yaml,在 models: 陣列中,依樣畫葫蘆增加一組設定,大方地給它取個響亮的 title,並將 model 欄位精準填入你剛剛下載的名稱:
儲存後,你的 Continue 選單就瞬間升級,擁有了這款隱藏版的核武級 AI 模型!
5. 榨乾 M2 Max 統一記憶體:2026 最新 MoE 模型終極推薦名單
既然你花了大錢投資了配備 M2 Max 晶片的 Mac Studio,這意味著你擁有極大的統一記憶體(通常是 32GB 甚至高達 96GB)。如果只讓它跑小參數的輕量級模型,簡直是暴殄天物!進入 2026 年,混合專家 (MoE) 架構已經是標配,它們在理解複雜程式架構、找出深層 Bug 與撰寫具有高度邏輯性的架構代碼時,表現是輾壓級別的。
為了不浪費你的硬體效能,我特別精選了幾款目前開源界評價最高,且非常適合在 M2 Max 上流暢運行的進階模型。你可以直接將下方指令複製到終端機執行:
2026 年的繁體中文開發霸主!原生支援最新 MLX 加速,35B 的參數量在 M2 Max 上跑起來速度與邏輯兼具,處理大型專案重構更是得心應手。
ollama pull qwen3.6:35bGoogle 團隊操刀的最強混合專家架構。它能極度精準地抓出深層級別的 Bug,並給出超高品質的重構建議,是除錯時的完美大腦。
ollama pull gemma3-moe主打極致反應速度與超過 200k 的驚人上下文視窗。適合一次丟入幾十個關聯的腳本檔案或整份最新的技術官方文件讓它閱讀。
ollama pull deepseek-v4-flash6. 補充教學:一鍵移除不需要的模型,釋放硬碟空間
AI 模型雖然強大,但每個動輒幾 GB 甚至幾十 GB,時間久了難免會佔用大量 Mac Studio 的硬碟空間。當你測試完某個模型覺得不適用,或者想汰換舊版本時,移除的方法也非常簡單,一樣在終端機搞定。
首先,如果你忘記了當初下載的準確名稱,可以輸入以下指令查詢目前安裝了哪些模型:
接著,找到你想移除的模型名稱(例如 qwen3.6:35b),使用 rm 指令將其徹底刪除:
💡 最後的小提醒: 移除模型後,別忘了回到 VS Code 打開 Continue 的 config.yaml,把 models 區塊裡對應的那組設定刪除。這樣你的下拉選單才會保持乾淨,不會出現點了卻無法運作的「幽靈模型」喔!
擁有 Mac Studio M2 Max 的你,已經具備了打造私人頂級 AI 實驗室的最強門票。捨棄繁冗的介面,回歸清爽高效的 Ollama 與 Continue 組合,你會發現寫程式的效率將迎來前所未有的飛躍。現在就打開你的終端機,開始構建你的超強 AI 寫碼工作站吧!如果在設定過程中遇到任何奇奇怪怪的 Bug,歡迎在下方留言,我們一起交流討論!
本文提供之軟體設定教學、終端機操作指令及環境配置指南,僅供讀者學術交流與本地端開發測試參考。由於開源軟體(Ollama, VS Code, Continue)版本迭代頻繁,操作介面或指令寫法可能隨時間有所變動。於本機環境執行任何下載、安裝或系統檔案修改前,請務必了解該指令之具體作用,並自行評估硬體資源及資訊安全風險(如:切勿將本地端 API 埠暴露於公共網路環境)。若因參照本文操作而導致資料遺失、系統不穩定或硬體異常耗損,本站概不承擔任何法律責任。
留言
張貼留言