資料擷取及整合工具FormX 文書處理自動化

資料擷取及整合工具FormX 文書處理自動化

疫情時期,本地湧現多類資助計劃;步入後疫情時代,商場及商戶紛紛推出會員獎賞計劃吸引消費者,但申請時需要填寫或輸入大量資料,相當費時失事。人手填寫文件往往出現錯漏,隨著科技進步,本地初創公司Oursky研發出資料擷取及整合工具FormX,將大量紙本資料數碼化,節省人力物力。

撰文:經一編輯部| 圖片:新傳媒編輯部、受訪者授權圖片

(圖片來源:受訪者授權圖片)
(圖片來源:受訪者授權圖片)

FormX的用戶包括政府消費券計劃、李嘉誠基金會、停車場及商場會員計劃,同時容許用戶在沒有編程基礎下,自行設立資料擷取模板及測試。

市民或企業參加各類資助及會員計劃時,均要填寫或輸入大量資料,相當費時失事,甚至因為過於繁複,令人放棄申請。

有見文書處理自動化需求增加,本地軟件開發公司Oursky,於2019年運用深度學習人工神經網絡(Artificial Neural Network,ANN)技術,自主研發精準便捷的人工智能(AI)資料擷取及整合工具 FormX,讓用戶節省時間及人力,並減少人為錯誤。

免編程設計

自FormX推出市場以來,兩年間已經吸引逾100個用戶,包括政府消費券計劃、李嘉誠基金會中小企「應急錢」計劃及威信停車場手機App,幫助他們將大量紙本資料數碼化,加快計劃進度。

FormX研發團隊明白小型或微型企業未必擁有程式開發人員,為了降低使用門檻,讓更多用戶能夠享用科技便利,團隊推出「免編程設計」,簡化介面,用戶在沒有編程基礎下,亦能夠自行設立資料擷取模板及測試。

以簡單的收據為例,用戶只需要在系統上傳一張樣本,之後篩選想要擷取的資料,便完成基本設置。

相比起聘用程式設計師從零開始建立一個專屬的系統,FormX 的「免編程設計」大大縮減用戶建立系統的時間及成本,省卻與設計師前期溝通、開發及修改等過程。

Oursky研發部成長駭客楊婉翔(May)表示:「我們研發FormX時,冀望此軟件能夠滿足本地用戶各類型文件電子化需求,現已支援購物收據、銀行月結單、會員申請表格、運貨單、普遍政府牌照及許可證等。」

(圖片來源:受訪者授權圖片)
(圖片來源:受訪者授權圖片)

用戶極速建立系統

而FormX系統分為「預設數據擷取模版」及「自訂擷取模版」,用戶如使用預設,只需要幾分鐘,即可完成設置,並嵌入自家網站或應用程式。

若用戶需要擷取特定的內容,可自行設立專屬的數據擷取模版,或者與FormX研發團隊進一步溝通,以達到理想成效。

針對市場需要,FormX團隊運用人工神經網絡技術預先進行深度學習,制定一系列「預設數據擷取模版」,適用於大部分停車場及商場收據。

如威信停車場的手機App,採用FormX解決車主轉賬記錄登記問題,車主採用轉賬方式繳費後,可以即時掃描「入數紙」快速登記,確認完成繳費程序。

另部分商場推出會員積分計劃,要求會員在應用程式中上載收據登記積分,現時已有數個商場的會員App,使用FormX優化掃描及登記過程,會員拍攝收據後,只需數秒便能自動擷取收據上的日期、收據編號、付款金額和付款方式等,完成積分登記。

「簡單便利的過程,有助鼓勵會員使用積分系統,與此同時,也為企業高效率地處理繁鎖的資料。」

擷取資料較多的用戶,常用自訂擷取模版或需要FormX提供設置支援。

以李嘉誠基金會中小企「應急錢」計劃為例,系統需要處理申請者的商業登記證。

FormX團隊為該計劃細心設計精準的模板,一星期內便完成整個系統設立,以取代人手辨認和輸入大量文件,大幅減省處理時間;亦能提供更好的使用者體驗(user experience),減少申請者輸入資料的時間。

團隊為消費券計劃提供服務時,同樣需要在短時間內完成系統設置,申請者只需上傳文件,機構使用FormX可以在數秒內擷取相關資料,有助短期內處理大量文件,完成消費券申請。

團隊現正開發新功能,不久將來可讓無編程背景的大眾,也能自行用FormX的「自訂擷取模版」功能。

提高圖片識別率

FormX的應用程式介面(API)及雲端服務(SaaS)大大縮短設置專屬模板的時間,API簡單易用,直接接駁至客戶的系統,其通用擷取模型能處理各式各樣的文件,只需數分鐘的設置即可套用在所需的文件類型。

通過網絡提供按需即用(On-demand)的服務,省卻了傳統軟件的安裝及部署時間;如有資料需要於本地處理,亦可以部署於私有雲。

「我們把整合的資料歸檔至JSON 格式,對於大型企業而言尤其重要,開發人員可直接使用擷取的數據,無縫地連接到任何軟件中,或者管理數據檔案。」

上世紀90年代起,市場上已經有很多解決方案,嘗試從文件提取資料。

然而傳統光學文字辨識(OCR)技術存在許多限制,開發人員需要花很長時間編程,成本高昂,而且應用在實際環境如處理手機拍攝的文件時,無法自動調節光線和位置,效果並不理想。

FormX研發團隊集合開發人工智能的專業人才,持續將國際上最新的研究成果,應用到產品當中。

利用人工智能訓練文件擷取模型,配合不同文件的排版及資訊結構,令AI學會自動校正文件圖片和調整光暗及對比度,辨認照片中的文件,並擷取合適的資料,使準確度大大提升。

(圖片來源:受訪者授權圖片)
(圖片來源:受訪者授權圖片)

高識別能力不僅提高處理過程,也能夠推動更多人使用電子化工具。

文件電子化應用範疇廣闊,擁有龐大的發展潛力。

FormX目前支援繁、簡、英,適用於亞太地區及英語通用國家,正計劃打入亞太及英國市場,計劃未來支援更多語言,把產品功能帶到其他市場,為國際市場提供在地化產品,並且挑戰海外矽谷新創團隊,和大公司相似的產品,如亞馬遜(Amazon)的Amazon Textract競爭。

幫助長者居家養老

FormX推出初期,已有本地護理機構用作醫療檔案電子化,幫助長者居家養老,因為長者的照顧者,經常需要幫助他們處理各種紙本醫療檔案,例如覆診紙。

瑞高護理提供居家養老護理服務,他們使用FormX優化「照顧站」App的檔案電子化功能,協助照顧者輕鬆管理長者的醫療預約,只需用手機掃描覆診紙,該App便能紀錄覆診日期並且排程,在到期日提醒照顧者。