7 月 10 日消息,Databricks 日前發布大數據分析平臺Spark 所用的 AI 模型 SDK,開發者寫代碼時,可用英文下指令,編譯器就會將英文指令轉換為 PySpark 或 SQL 語言代碼,以提升開發者效率。
據悉,Spark 是一款開源大數據分析工具,每年超過 10 億次下載、在全球 208 個國家和地區使用。
Databricks 表示,微軟的 AI 代碼助手 GitHubCopilot 固然強大,但使用門檻也相當高,Databricks 的 SDK 相對更具普適性,更易于上手。
Databricks 聲稱,他們發現大型語言模型非常了解 Spark,Spark 社區在過去 10 年貢獻大量的開放、高質量文本以供 AI 學習發展。Databricks 團隊也正是憑借 Spark 社區提供的一系列學習數據進行訓練,用 LLM 開發一套英文版 SDK。開發者利用這套 SDK,即可直接用英文下指令,并得到相對應結果,提升開發效率。
IT之家發現,Databricks 同時聲稱,當下這款英文版 SDK 還在早期開發階段,他們歡迎更多使用者加入使用,來提升這款 SDK。
關鍵詞: