4 月 29 日消息,GitHub 依舊是開發者領域的主流平臺,圍繞代碼託管、團隊協作與開源開發形成了龐大的生態體系。即便在被微軟收購之後,GitHub 仍保持自然增長態勢,這一勢頭一直延續到去年。而 2025 年初,AI 編程熱潮開始進一步推高 GitHub 的使用量。此後,隨著智能體在開發者群體中成為主流,GitHub 的用戶使用規模迎來了前所未有的爆發式增長。
記者注意到,GitHub 於 2025 年 10 月啟動了一項擴容計畫,目標是將平臺承載能力提升至原有 10 倍,以此應對激增的需求。然而到 2026 年 2 月,公司意識到,未來的業務規模或將達到當前的 30 倍,必須提前做好佈局。這種空前的增長壓力,已嚴重拖累了平臺的穩定性。事實上,過去數月間,GitHub 不僅發生過數次影響廣大開發者的重大故障,還出現了多起小規模服務中斷事件。
今日,GitHub 團隊發佈官方博客,就平臺現狀作出說明。概括而言,團隊目前正在重構部分底層基礎設施,旨在提升平臺的可用性、可擴展性與抗故障能力。人工智慧賦能的軟體開發,使得代碼倉庫創建、合併請求活躍度、介面調用、自動化流程以及大型倉庫負載等各項業務均迎來極速增長。以 GitHub 如今的體量來看,任何子系統中微小的效率短板,久而久之都會演變成嚴重的系統性問題。
對於複雜的網路服務而言,服務中斷本是常見現象,但 GitHub 頻發的故障已引發用戶公開抱怨。知名專案 Ghostly 的開發者米切爾・橋本今日也發佈博客表示,由於近幾個月平臺頻繁出現穩定性問題,他決定將 Ghostly 專案從 GitHub 遷移至其他平臺。
為解決用戶面臨的各類問題,GitHub 團隊現已確立優先順序排序:優先保障服務可用性,其次擴充承載容量,最後再迭代新功能。過去幾個月裏,團隊已完成多項優化,化解了多處性能瓶頸。同時,GitHub 將部分算力需求遷移至微軟 Azure 雲平臺後,得以根據業務負載靈活彈性擴容。為進一步降低故障影響,GitHub 正將 Git、GitHub Actions 等核心關鍵服務與其他業務負載進行物理隔離。官方還證實,正在推進多雲架構建設,以全面提升平臺的容災抗風險能力。
GitHub 還披露了近期兩起故障事件的詳細情況:
4 月 23 日,平臺出現功能回退問題,導致合併佇列功能異常,此次故障共計影響 658 個代碼倉庫、2092 個合併請求。
4 月 27 日,平臺 Elasticsearch 搜索引擎子系統突發獨立故障,目前官方仍在開展根本原因分析。GitHub 表示,本次事件未造成任何數據丟失,Git 基礎操作與開放介面服務均未受波及,但依賴搜索功能的部分頁面無法展示檢索結果,給用戶使用造成了明顯困擾。
GitHub 在博客文末再次致歉,並承諾將持續致力於提升服務可用性、增強平臺抗故障能力,同時優化故障發生期間及事後的官方溝通機制。
來源:中國IT之家