馬斯克表示,特斯拉Dojo AI 訓練計算機正在取得進展。我們將于今年晚些時候上線下一代AI芯片Dojo 2。一項新技術要經(jīng)過三次重大迭代才能成為偉大的技術。Dojo 2已經(jīng)很好了,但Dojo 3一定會更棒。
特斯拉AI官方發(fā)文的內(nèi)容是其最新的Dojo技術報告。特斯拉AI表示Dojo超級計算機正面臨制造缺陷和老化導致的靜默數(shù)據(jù)損壞(SDC)問題。與傳統(tǒng)的系統(tǒng)崩潰不同,這些缺陷不會立即暴露,而是在訓練過程中悄無聲息地破壞數(shù)據(jù)完整性。
一個有缺陷的節(jié)點可能導致耗時數(shù)周的AI模型訓練產(chǎn)生錯誤結(jié)果,或使收斂速度顯著放緩。更致命的是,這些問題在模型訓練完成后幾乎無法檢測——企業(yè)可能在不知情的情況下部署了基于損壞數(shù)據(jù)訓練的AI系統(tǒng)。
Dojo是特斯拉設計的超級計算機系統(tǒng),用作人工智能,特別是FSD的訓練場。這個名字是對武術練習道場的致敬。
超級計算機由數(shù)千臺稱為節(jié)點的小型計算機組成。這些節(jié)點各自擁有自己的CPU(中央處理單元)和GPU(圖形處理單元)。前者負責節(jié)點的總體管理,后者則處理復雜的事情,比如將任務分割成多個部分并同時進行處理。
免責聲明:文章只做訊息的收集及分享,文章來源:新浪財經(jīng)、半導體芯聞,版權(quán)歸原撰寫發(fā)布機構(gòu)所有,如涉及侵權(quán),請聯(lián)系我們刪除。