亚洲一区二区三区视频在线_国产在线精品免费av_精品国产一区二区三区忘忧草 _日本道色综合久久

首頁 資訊 國內 聚焦 教育 關注 熱點 要聞 民生1+1 國內

您的位置:首頁>資訊 > 經濟 >

焦點日報:合合信息突破“版面分析”技術難點 讓AI更好地“閱讀分類”

來源:證券日報網     發布時間:2023-04-13 17:11:01

本報記者 施露

近期,人工智能及大數據科技企業合合信息持續突破版面分析技術在版面分割、區域間的邏輯關系處理等方面的難題,通過智能文字識別、智能圖像處理等核心技術,助力使用者從各類復雜的圖片文檔中精準獲取信息。

版面分析的目的是讓機器“看懂”文檔結構,即將文檔圖像分割成不同類型內容的區域,并分析區域之間的關系,這是內容識別之前的關鍵步驟。據中國科學院自動化研究所多模態人工智能系統全國重點實驗室聯合多所高校發布的論文顯示,版面分析主要包括物理版面分析(區域分割、分類,文本檢測與定位,文本行分割等),手寫及印刷區分,表格分析(單元格提取與關系分析),邏輯版面分析(區域語義分類、閱讀順序),以及簽名、圖標、印章等版面元素的提取等。


(相關資料圖)

從20世紀80年代開始,較多專門研究版面分析的工作成果開始涌現,此后經歷了多番理念方法迭代。傳統的版面分析方法在進行版面布局分析和表格處理時會明顯受制于版式差異,在應對不同場景下的文檔圖片時泛化效果存在缺陷,而深度神經網絡的引入有效解決了這些問題。

合合信息技術人員在采訪中提到,得益于全卷積神經網絡(FCN)和圖神經網絡(GNN)的突破,文檔版面分析的方法和性能得到了很大發展。公司基于深度學習的方法,結合文本區域的幾何坐標、視覺特征、文本語義等多種模態信息對文本閱讀順序進行預測,顯著提升分類結果。

同時,合合信息表格結構解析方法在邏輯版面分析中也發揮了重要作用,主要包括自上而下的方法、自下而上的方法以及端到端圖像到標記的方法等。在財報相關表格識別測試中,有線表識別單元格結構準確率高于98%;無線表識別中,在保證表格區域內容的完整性的同時,檢測準確率較傳統方法顯著提升。

對于研究人員或學生群體而言,版面分析與OCR技術的結合可以廣泛應用于課件、試卷、作業、學術論文等材料的數字化處理,自動識別和提取多種教育類文檔文本、圖像、公式、表格等元素進行不同場景的應用,簡化教學和學習過程。

商務場景中,版面分析與OCR技術能自動識別和提取財務數據、圖表、文本等信息,并將印刷財報轉換為可分析的電子數據,在處理不同類型的財務報表時,能夠提升報告分析效率和準確性,幫助相關人員實現公司財務報告、審計報告、年度報告等文件的自動處理和分析。

此外,版面分析相關技術還可作用于文化保護,通過自動識別和提取各種類型書籍的表格、圖像信息,將不同時代、多種印刷版式、多種概念的紙質圖樣按照符合人類理解的格式進行電子化存儲,幫助實現文獻、古籍、報紙、雜志等資料的數字化和知識管理。

相關研究表明,現階段,針對復雜版面文檔和拍照變形文檔的分析識別仍存在性能不足的情況。這個細小卻重要的技術還需要更多的研究機構及科技企業加入進來,共同推動理論的研究與應用的突破。

(編輯 張薌逸)

關鍵詞:

頻道精選

首頁 | 城市快報 | 國內新聞 | 教育播報 | 在線訪談 | 本網原創 | 娛樂看點

Copyright @2008-2018 經貿網 版權所有 皖ICP備2022009963號-11
本站點信息未經允許不得復制或鏡像 聯系郵箱:39 60 29 14 2 @qq.com

主站蜘蛛池模板: 国产精品亚洲аv天堂网| 久久久99免费视频| 久久视频在线免费观看| 久久国产精品久久久久V| 国产成人精品a视频一区www| 日韩精品在在线一区二区中文| 久久久久久久91| 亚洲中文字幕无码不卡电影| 91av中文字幕| 中文字幕欧美日韩一区二区| 国产精品福利观看| 91高潮在线观看| 久久久国产一区| 日本一区二区视频| 久久人人97超碰精品888| 日韩在线中文视频| 欧美亚洲国产日本| 在线一区日本视频| av在线亚洲男人的天堂| 欧美 国产 综合| 欧美亚洲国产另类| 国产成人精品a视频一区www| 国产精品美女999| 日本一区视频在线播放| 国产欧洲精品视频| 久久综合给合久久狠狠色| 国产精品久久精品视| 日韩欧美一级在线| 久久久国产精品一区| 亚洲午夜精品福利| 国产精品久久久久久久久粉嫩av | 欧美高清中文字幕| 国产日产欧美视频| 少妇免费毛片久久久久久久久| 欧美精品在线一区| 久久国产精品视频| 国产精品视频xxxx| 91精品视频在线看| 免费99精品国产自在在线| 久久精品久久久久| 国产一区二区精品免费|