一、企業(yè)簡介
金現(xiàn)代(300830)信息產(chǎn)業(yè)股份有限公司(以下簡稱“公司”),是國家鼓勵的重點軟件企業(yè),國家高新技術(shù)企業(yè),深交所創(chuàng)業(yè)板上市企業(yè)(證券簡稱:金現(xiàn)代;證券代碼:300830)。公司致力于電力、軌道交通、石化、工業(yè)制造等行業(yè)管理軟件的研發(fā)與推廣,是國內(nèi)主要的行業(yè)信息化解決方案提供商,目前公司產(chǎn)品及服務(wù)已遍布全國22個省、5個自治區(qū)和4個直轄市,主要客戶包括國家電網(wǎng)、南方電網(wǎng)、五大發(fā)電集團、國家鐵路集團等世界500強企業(yè)。
【資料圖】
二、案例概述
工程圖紙廣泛用于火電、核電、水利、建筑、制造業(yè)等行業(yè)。工程圖紙對于設(shè)備和建筑故障、隱患的排查十分重要。因此,根據(jù)現(xiàn)場信息快速查詢工程圖紙成為一種廣泛需求。而受限于數(shù)字化改造的滯后,工程圖紙的信息往往保留在紙質(zhì)圖紙或單獨的圖紙電子文件中,無法通過數(shù)據(jù)庫進行查詢,導致調(diào)閱一個工程圖紙常要花費數(shù)天的時間,效率低下。此外,實物化的工程圖紙容易受潮和光照影響,保存時間短。因此迫切需要一種技術(shù)實現(xiàn)工程圖紙的電子化,實現(xiàn)工程圖紙信息的結(jié)構(gòu)化查詢。雖然在AI技術(shù)的不斷發(fā)展下,通用OCR模型在常規(guī)的文檔識別準確率上已經(jīng)取得了極高的準確率。但針對工程圖紙中物料編碼、元器件編號的文字識別,通用OCR模型在圖紙中的文字檢測識別中識別準確率不佳,存在誤識別、漏識別等問題。造成這種問題主要是因為圖紙圖像的尺寸很大而文字尺寸很小、文字與符號框貼合較近、部分器件符號容易被誤識別為文字、以及文字分布隨意方向隨意等。
金現(xiàn)代提供的方案使用深度學習、圖像處理等關(guān)鍵技術(shù),使用多種策略構(gòu)建和增廣數(shù)據(jù)集,并自主研發(fā)訓練文字檢測和文字識別模型,解決了小尺寸文字識別、漏識別、誤識別等問題,最終提升了圖紙中文字檢測與識別的準確率和效率,為圖紙電子化數(shù)據(jù)的檢索和應(yīng)用發(fā)揮了不可替代的作用。
圖1圖紙圖像示例
圖2圖紙檢測與識別結(jié)果
三、’應(yīng)用成效
(1)單張圖紙識別速度<1s,提供圖紙識別服務(wù)接口。
(2)適用于膠片、紙質(zhì)等不同類型的圖紙。
(3)客戶圖紙查詢方式全面接入業(yè)務(wù)系統(tǒng)。與原有手工查詢方式相比,查詢速度由數(shù)天提升到秒級,效率提升上千倍。
(4)圖紙識別準確度>98%。
四、應(yīng)用場景
本方案在設(shè)計研究院等單位中為設(shè)計圖紙的電子化檢索應(yīng)用發(fā)揮了極大的作用,對傳統(tǒng)圖紙管理服務(wù)的轉(zhuǎn)型升級起到了示范作用,有效降低了管理人員數(shù)量,提高借閱效率和服務(wù)水平,具有廣闊的應(yīng)用推廣前景。
五、主要創(chuàng)新點
(1)實現(xiàn)圖紙中小目標文本的檢測。
(2)結(jié)合目標檢測技術(shù),解決元器件符號易誤識別為文字的問題。
(3)結(jié)合圖像處理技術(shù),解決堆疊文字檢測準確率較低的問題。
(4)構(gòu)建圖紙專用數(shù)據(jù)集,微調(diào)文字識別模型擴增字符識別種類。
六、后續(xù)規(guī)劃
在OCR領(lǐng)域,我們將繼續(xù)加強人工智能的研究,并結(jié)合用戶實際需求,積極拓展其在更多領(lǐng)域的嘗試和應(yīng)用,以進一步為企業(yè)降低成本、提高效率,并提供更多滿意的解決方案。