Google 宣佈推出一款全新的 Visual Studio Code 擴展,可將本地筆記本連接到 Colab 運行環境。這使開發者能夠將原本分離的本地開發環境與基於網頁的 Colab 環境整合到一起。
Google Colab 團隊表示,他們通過社區反饋(包括博客文章、論壇討論和熱門 GitHub 倉庫中記錄的各種解決方案)發現了這兩種環境之間存在的差距。
直到現在,這兩個世界基本上是分開的。用户通常會使用自定義的 VS Code 環境來進行項目開發,而使用基於網頁的 Colab 環境來執行筆記本、可視化和訓練/推理任務。
藉助全新的 Visual Studio Code Colab 擴展,開發者可以在自己熟悉的 VS Code 編輯器中直接使用 Colab,只需將本地筆記本連接到 Colab 運行環境即可,包括支持高級 GPU 和 TPU 的 Pro 級運行環境。
對於 Colab 用户來説,這款擴展支持多種常見工作流程,例如處理屬於更大項目或 Git 倉庫中的筆記本。同時,相比於網頁版的 Colab 編輯器,他們還能使用 VS Code 提供的更強大 IDE 功能。機器學習工程師 Wesley Kambale 在文章中介紹了這項集成帶來的多種高級工作流程,例如使用 RAPIDS cuDF 在 GPU 上加速大規模數據分析、在 VS Code 中直接生成藝術作品等。Kambale 表示,這項集成:
讓開發者和機器學習工程師能夠在自己偏好的編輯器中直接使用免費的 GPU 和 TPU,從而簡化工作流程,加速創新。雖然目前仍處於早期階段,但這款擴展是讓 AI 和機器學習開發更易用、更高效的重要一步。
Google 開發者 Glen Yu 解釋説,Colab 最初是為網頁界面設計的,因此有些功能在 VS Code 中無法完全復現。例如,開發者無法通過 userdata.get() 訪問用户數據,也無法使用 drive.mount() 掛載 Google Drive。在他的文章中,Yu 還介紹瞭如何使用 Colab 擴展通過 LoRA 微調 gemma_isntruct_1b,以及如何管理訪問外部服務所需的密鑰,以便使用機器學習模型。
完整的已知問題和解決方案列表可在 colab-vscode中查看。Colab 團隊還提到,他們會在GitHub issues 上的點贊數基礎上優先處理缺失功能。
在 VS Code 擴展發佈之前,開發者通常依賴各種變通方法來連接這兩種環境。常見的方式是通過 GitHub 和 git,先在本地編輯筆記本,然後推送到倉庫,再通過 Google Colab 打開。對於更高級的集成,一些開發者會使用 遠程隧道,將本地機器連接到 Colab 運行環境。而在更簡單的情況下,開發者也可以直接在 Colab 中連接 Google Drive 存儲來同步文件。