通用文字識別
產(chǎn)品介紹
通用文字識別(General Optical Character Recognition,General OCR)基于行業(yè)前沿的深度學習技術,提供通用印刷體識別、通用印刷體識別(高精度版)、通用手寫體識別、英文識別等多種服務,支持將圖片上的文字內(nèi)容,智能識別為可編輯的文本,可應用于隨手拍掃描、紙質文檔電子化、電商廣告審核等多種場景,大幅提升信息處理效率。
功能介紹
功能列表
通用印刷體識別
支持多場景、任意版面下整圖文字的識別。支持自動識別語言類型,同時支持自選語言種類(推薦),除中英文外,支持日語、韓語、西班牙語、法語、德語、葡萄牙語、越南語、馬來語、俄語、意大利語、荷蘭語、瑞典語、芬蘭語、丹麥語、挪威語、匈牙利語、泰語等多種語言。應用場景包括:印刷文檔識別、網(wǎng)絡圖片識別、廣告圖文字識別、街景店招識別、菜單識別、視頻標題識別、頭像文字識別等。
支持圖像整體文字的檢測和識別,返回文字框位置與文字內(nèi)容。相比通用印刷體識別接口,準確率和召回率更高。
支持多場景、任意版面下整圖文字的識別。相較于“通用印刷體識別”接口,精簡版接口在準召率有一定損失的情況下,耗時更短。適用于對接口耗時較為敏感的客戶。
支持圖像整體文字的檢測和識別,返回文字框位置與文字內(nèi)容。暫未支持多語種識別,推薦使用通用印刷體識別接口。
支持多場景、任意版面下整圖文字中的手寫中文、英文、字母、數(shù)字、常見字符的識別。針對手寫字體無規(guī)則、字跡潦草、模糊等特點進行了識別能力的增強?蓱糜阢y行、保險、金融等手寫單據(jù)錄入、教育行業(yè)筆記文檔化等場景。
支持圖像英文文字的檢測和識別,返回文字框位置與文字內(nèi)容。支持多場景、任意版面下的英文、字母、數(shù)字和常見字符的識別,同時覆蓋英文印刷體和英文手寫體識別。可應用于英文筆記作業(yè)文檔化、英文試卷答題卡識別等場景。
支持廣告商品圖片內(nèi)文字的檢測和識別,返回文本框位置與文字內(nèi)容。支持中英文、橫排和豎排文字識別,支持90度、180度、270度翻轉以及傾斜場景文字識別。文字識別的召回率和準確率能達到96%以上。
通過檢測圖片中的文字信息特征,快速判斷圖片中有無文字并返回判斷結果,幫助用戶過濾無文字的圖片。
通用印刷體識別(高精度版)
通用印刷體識別(精簡版)
通用印刷體識別(高速版)
通用手寫體識別
英文識別
廣告文字識別
快速文本檢測
- 上一篇:音頻文件轉寫 2022/8/8
- 下一篇:長江流域生態(tài)氣象遙感監(jiān)測年報發(fā)布 生態(tài)環(huán)境質量持續(xù)改善 2022/7/26