過去,每到月末,公司財(cái)務(wù)都會(huì)犯愁,面對(duì)一堆發(fā)票,增值稅發(fā)票、火車票、行程單、船票、出租車票、小票等,手工錄入耗費(fèi)大量時(shí)間。現(xiàn)在,財(cái)務(wù)再也不用為陷入海量票據(jù)而發(fā)愁,因?yàn)橛辛?
OCR技術(shù)。
近日,中關(guān)村科金基于自研的機(jī)器視覺和NLP技術(shù),發(fā)布了一站式全流程文字識(shí)別產(chǎn)品“得助OCR平臺(tái)”。該平臺(tái)賦予機(jī)器能夠讀懂文字能力,不僅可識(shí)別海量票據(jù)信息并批量導(dǎo)出,提升企業(yè)日常辦公場景下資料錄入整理和審核的效率,而且可以自定義文字識(shí)別模型,讓企業(yè)掌握關(guān)鍵技術(shù)且自主可控、精度高,響應(yīng)快。
OCR需求大,自建OCR平臺(tái)面臨諸多挑戰(zhàn)
OCR (Optical Character Recognition,光學(xué)字符識(shí)別)是指針對(duì)印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。
隨著各行各業(yè)數(shù)字化轉(zhuǎn)型提速,涉及憑證票證類別的需求不斷增加,業(yè)務(wù)人員每天面對(duì)大量繁雜、重復(fù)的信息錄入和流程審核工作,OCR需求壓力越來越大,企業(yè)亟需建設(shè)自身的OCR平臺(tái),但面臨定制成本高、核心模型管理不能自主掌控、效果迭代不及時(shí)等諸多挑戰(zhàn)。
中關(guān)村科金推得助OCR平臺(tái),助力企業(yè)降本增效
針對(duì)行業(yè)痛點(diǎn),中關(guān)村科金推出的得助OCR平臺(tái),即使零算法經(jīng)驗(yàn)人員,基于自身業(yè)務(wù)場景數(shù)據(jù),通過該平臺(tái)隨時(shí)可以迭代專屬模型,快速提升企業(yè)數(shù)字化能力!
該平臺(tái)采用自研機(jī)器視覺和NLP技術(shù),通過內(nèi)置智能圖像預(yù)處理、文字檢測、文字識(shí)別和多模態(tài)結(jié)構(gòu)化分析等四大引擎,從而提升人工錄入文字和業(yè)務(wù)審核效率,實(shí)現(xiàn)企業(yè)降本增效,助力企業(yè)數(shù)字化轉(zhuǎn)型。
平臺(tái)包含4大產(chǎn)品矩陣:OCR自訓(xùn)練平臺(tái)、SAAS能力平臺(tái)、原子算法庫和垂直場景解決方案,可以提供全場景、高精度的文字識(shí)別服務(wù)。其中,OCR自訓(xùn)練平臺(tái),面向0算法經(jīng)驗(yàn)人員實(shí)現(xiàn)一站式全流程模型管理能力,通過私有化部署到自身業(yè)務(wù)場景,隨時(shí)可以迭代專屬模型,解決模型迭代依賴技術(shù)供應(yīng)商、模型精度不能持續(xù)提升、數(shù)據(jù)安全合規(guī)、業(yè)務(wù)響應(yīng)慢等痛點(diǎn),讓企業(yè)實(shí)現(xiàn)真正意義自定義OCR模型能力,掌握關(guān)鍵技術(shù)且自主可控。
該平臺(tái)可以自定義文字識(shí)別模型,具備自主掌控、識(shí)別精度高、數(shù)據(jù)安全合規(guī)、業(yè)務(wù)響應(yīng)快四大優(yōu)勢(shì):
1、企業(yè)可自主掌控核心技術(shù),不依賴技術(shù)商
傳統(tǒng)OCR解決方案,面對(duì)新的業(yè)務(wù)場景OCR需求,需要依賴技術(shù)供應(yīng)商,核心技術(shù)無法自主掌控。通過使用自訓(xùn)練工具,不管是固定版式還是復(fù)雜版式需求,都可以自主生產(chǎn)需要的模型。
2、識(shí)別精度高,提升業(yè)務(wù)效率,節(jié)省人力
通過自主訓(xùn)練的模型,完全適配自身業(yè)務(wù)場景數(shù)據(jù),做到完全量身定制的產(chǎn)品,更好的服務(wù)自身業(yè)務(wù)。另外平臺(tái)內(nèi)置了經(jīng)過真實(shí)場景驗(yàn)證的OCR預(yù)訓(xùn)練模型,清晰文本識(shí)準(zhǔn)確率95%以上,助力提升業(yè)務(wù)效率,節(jié)省人力成本。
3、數(shù)據(jù)安全合規(guī),有效防范泄露風(fēng)險(xiǎn)
模型在生產(chǎn)環(huán)境使用過程中,會(huì)出現(xiàn)精度下降的問題。如何迭代模型效果,傳統(tǒng)做法將數(shù)據(jù)交給技術(shù)供應(yīng)商進(jìn)行優(yōu)化算法,存在數(shù)據(jù)泄露風(fēng)險(xiǎn)。
4、業(yè)務(wù)響應(yīng)快,快速賦能業(yè)務(wù)
傳統(tǒng)模型迭代過程,需要經(jīng)過需求溝通、招標(biāo)、POC測試、投標(biāo)、交付實(shí)施等全流程,迭代周期非常長。面對(duì)緊迫的業(yè)務(wù)需求,如何最快獲得優(yōu)化好的模型?通過自訓(xùn)練模型,業(yè)務(wù)人員隨時(shí)可以迭代模型效果,0秒延遲啟動(dòng)算法優(yōu)化,交付周期預(yù)計(jì)縮短80%以上,快速賦能業(yè)務(wù)。
得助OCR平臺(tái)可適用于銀行票據(jù)處理、合同文檔、身份驗(yàn)證、交通票據(jù)等80+場景,幫助企業(yè)快速提升業(yè)務(wù)效率,節(jié)省人力成本,推動(dòng)企業(yè)數(shù)字化轉(zhuǎn)型發(fā)展。
以銀行票據(jù)信息錄入為例,銀行票據(jù)種類多,人力成本投入巨大。針對(duì)數(shù)據(jù)標(biāo)注過程枯燥繁瑣、機(jī)械性高,大量訓(xùn)練數(shù)據(jù)需要人工標(biāo)記,時(shí)間金錢成本昂貴問題,通過內(nèi)置智能半自動(dòng)標(biāo)注工具,標(biāo)注員只需要簡單審核機(jī)器標(biāo)注數(shù)據(jù)即可完成任務(wù),標(biāo)注效率提升50%以上,有效節(jié)省了人力成本。
對(duì)于深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)需求大問題,平臺(tái)內(nèi)置數(shù)據(jù)合成工具,后臺(tái)自動(dòng)生成超過100倍級(jí)人工標(biāo)注量的合成數(shù)據(jù)加入模型訓(xùn)練,提升模型效果,文字識(shí)別精度高達(dá)96%以上,相比傳統(tǒng)方案,至少提升5個(gè)百分點(diǎn)。
通過得助OCR自訓(xùn)練工具可視化界面可完成數(shù)據(jù)標(biāo)注、模型訓(xùn)練、評(píng)價(jià)、測試及部署上線全流程,實(shí)現(xiàn)自主掌控關(guān)鍵技術(shù),節(jié)省人力成本,提升業(yè)務(wù)效率,加速企業(yè)持續(xù)規(guī)模化數(shù)字化轉(zhuǎn)型。
未來,中關(guān)村科金得助OCR平臺(tái)將根據(jù)自身在銀行、保險(xiǎn)、證券、信托、教育、醫(yī)療、智能制造等領(lǐng)域的深耕經(jīng)驗(yàn),不斷開拓和深入更多的應(yīng)用場景,依托強(qiáng)大的NLP算法和機(jī)器視覺技術(shù),洞悉用戶所需,快速響應(yīng)行業(yè)需求,確保高精度OCR識(shí)別效果,用更具前瞻性的人工智能科技賦能千行百業(yè)數(shù)字化發(fā)展。
新時(shí)代鞋服物流與供應(yīng)鏈面臨的變革和挑戰(zhàn)03月07日 20:38
點(diǎn)贊:這個(gè)雙11,物流大佬一起做了這件事11月22日 21:43
物流管理機(jī)構(gòu)及政策分布概覽12月04日 14:10
盤點(diǎn):2017中國零售業(yè)十大事件12月12日 13:57
2017年中國零售電商十大熱點(diǎn)事件點(diǎn)評(píng)12月28日 09:58