每天都在汆肉中醒来青梅,好男人www在线观看,少妇无码自慰毛片久久久久久,国产欧美另类久久久精品丝瓜

登錄注冊
新聞 資訊 金融 知識 財經 理財 科技 金融 經濟 產品 系統 連接 科技 聚焦
首頁 > 新聞 > 創業創新 > > 正文

微軟和英偉達推出迄今為止訓練最大最強的解碼語言模型

2021-10-12 17:12:12來源:IT之家

10 月 12 日消息 語言模型(Language Model)簡單來說就是一串詞序列的概率分布,主要作用是為一個長度為 m 的文本確定一個概率分布 P,表示這段文本存在的可能性。

大家之前可能或多或少聽說過 GPT-3,OpenAI 最新的語言模型,堪稱地表最強語言模型,也被認為是革命性的人工智能模型。除此之外還有 BERT、Switch Transformer 等重量級產品,而且業內其他企業也在努力推出自家的模型。

微軟和英偉達今天宣布了由 DeepSpeed 和 Megatron 驅動的 Megatron-Turing 自然語言生成模型(MT-NLG),這是迄今為止訓練的最大和最強大的解碼語言模型。

IT之家了解到,作為 Turing NLG 17B 和 Megatron-LM 的繼任者,這個模型包括 5300 億個參數,而且 MT-NLG 的參數數量是同類現有最大模型 GPT-3 的 3 倍,并在一系列廣泛的自然語言任務中展示了無與倫比的準確性,例如:

完成預測

閱讀理解

常識推理

自然語言推理

詞義消歧

105 層、基于轉換器的 MT-NLG 在零、單和少樣本設置中改進了先前最先進的模型,并為兩個模型規模的大規模語言模型設定了新標準和質量。

據悉,模型訓練是在基于 NVIDIA DGX SuperPOD 的 Selene 超級計算機上以混合精度完成的,該超級計算機由 560 個 DGX A100 服務器提供支持,這些服務器以完整的胖樹(FatTree)配置與 HDR InfiniBand 聯網。每個 DGX A100 有 8 個 NVIDIA A100 80GB Tensor Core GPU,通過 NVLink 和 NVSwitch 相互完全連接。微軟 Azure NDv4 云超級計算機使用了類似的參考架構。

關鍵詞: 訓練 最大 最強

熱點
39熱文一周熱點
主站蜘蛛池模板: 勃利县| 吐鲁番市| 江都市| 安国市| 彩票| 汶川县| 黄陵县| 阳泉市| 长沙市| 承德县| 玛多县| 屏南县| 左云县| 平顶山市| 嵊泗县| 疏附县| 丰都县| 南岸区| 亚东县| 新巴尔虎右旗| 万山特区| 鹰潭市| 清水河县| 宝鸡市| 灌云县| 凤冈县| 牡丹江市| 龙里县| 望奎县| 普洱| 承德县| 来宾市| 阿荣旗| 沁水县| 哈巴河县| 同心县| 龙南县| 通化市| 亳州市| 广饶县| 汉川市|