近日,2024中國圖象圖形大會在西安盛大開幕。這場由中國圖象圖形學學會主辦,空軍軍醫(yī)大學、西安交通大學、西北工業(yè)大學聯(lián)合承辦的盛會,匯聚了國內(nèi)外圖像圖形領(lǐng)域的頂尖專家和學者,通過二十多場論壇、百余項成果,集中展示了生成式人工智能、大模型、機器學習、類腦計算等多個領(lǐng)域的最新進展。
大模型技術(shù)作為本次大會的焦點之一,其強大的圖像處理能力引起了廣泛關(guān)注。隨著科技的不斷革新,大模型技術(shù)正在各個行業(yè)中得到廣泛應(yīng)用,滿足了對復(fù)雜圖像處理的多樣化需求。為了深入探討大模型技術(shù)的發(fā)展與應(yīng)用,大會期間特別舉辦了《大模型技術(shù)及其前沿應(yīng)用》論壇。
論壇上,來自華南理工大學、上海交通大學、清華大學、復(fù)旦大學、上海人工智能實驗室以及上海合合信息科技股份有限公司的專家代表們,圍繞大模型技術(shù)在圖像領(lǐng)域的發(fā)展、應(yīng)用進行了深入研討。他們一致認為,大模型技術(shù)的快速發(fā)展,不僅推動了圖像圖形領(lǐng)域的進步,也為相關(guān)行業(yè)的發(fā)展注入了新的活力。
然而,大模型技術(shù)的快速發(fā)展也面臨著一些挑戰(zhàn)。其中,模型訓練語料的“能源危機”就是亟待解決的問題之一。據(jù)人工智能研究人員小組Epoch研究估計,機器學習數(shù)據(jù)集可能會在2026年前耗盡所有“高質(zhì)量語言數(shù)據(jù)”。這一預(yù)測引發(fā)了與會者的深思。
針對這一問題,合合信息智能創(chuàng)新事業(yè)部研發(fā)總監(jiān)常揚在論壇上分享了合合信息智能文檔處理技術(shù)在文檔解析領(lǐng)域的工作。他強調(diào),文檔解析技術(shù)的進步能夠有效解決高質(zhì)量語料數(shù)據(jù)匱乏的問題。通過機器識別文檔中的多種元素,包括文本、表格、圖像等,該技術(shù)能夠更好地處理多類型數(shù)據(jù),還原文檔閱讀順序,加速大模型的訓練與應(yīng)用。此外,合合信息還打通了電子檔解析、掃描檔圖像處理、文字識別、表格識別、版面分析、版面還原和排版布局等文檔智能化處理的全流程。
常揚還詳細闡述了文檔解析技術(shù)的難點,即如何準確識別文檔中的各個元素,并理解其之間的邏輯關(guān)系。他提出,這需要關(guān)注“物理版面分析”和“邏輯版面分析”兩個方面。物理版面分析側(cè)重于視覺特征、文檔布局,而邏輯版面分析則側(cè)重于對語義特征的分析。通過這兩方面的結(jié)合,可以實現(xiàn)對文檔的全面解析。
本次大會的成功舉辦,不僅為圖像圖形領(lǐng)域的專家學者們提供了一個交流學習的平臺,也為大模型技術(shù)的發(fā)展和應(yīng)用指明了方向。未來,隨著技術(shù)的不斷進步和創(chuàng)新,我們有理由相信,大模型技術(shù)將在更多領(lǐng)域展現(xiàn)出其強大的應(yīng)用潛力。合合信息技術(shù)團隊也將持續(xù)在智能文檔處理領(lǐng)域深耕,讓新技術(shù)在行業(yè)中更快速地產(chǎn)生價值。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: