Votee AI

逼上梁山闖出新路 Votee AI小語種大商機

科技

廣告

近年生成式人工智能(GenAI)大熱,不少人遇上問題, 都會向ChatGPT、DeepSeek發問找尋答案。 相信大家都有這樣的經驗,使用英文或普通話發問,答案較為精準; 使用廣東話的話,答案有時怪怪的。 本港初創Votee AI處理廣東話數據遇上難題,結果被「逼上梁山」, 專注研發「小語種」的大語言模型(Large Language Model, LLM),以港人最親切的廣東話作為起點, 解決連ChatGPT、Gemini等國際級模型都難以完美處理的本地化語言難題。

英文及中文是全球最多人使用的語言,所以科技巨擘不惜斥巨資,使用海量的數據來訓練AI,結果訓練出這些語言的大語言模型(LLM)。 廣東話並非主流的語言,沒有大廠願意投資訓練相關的AI,所以只用這種語言發問的話,未必能夠獲得精準的答案。 本地初創公司Votee AI推出廣東話的LLM,並且獲得不同行業應用,包括消費品、教育、建築、金融、政府部門等。

Votee AI (圖片來源:被訪者提供)
(圖片來源:被訪者提供)

馬死落地行

Votee AI創辦人Jacky畢業於香港中文大學電腦科學系,很早便開始創業,最初從事遊戲代理及開發。 Jacky說:「我開始有一個疑問,到底初創公司能夠成功,靠的是運氣,還是自己的實力?於是開始接觸初創比賽,從而結識Pak,然後一起創辦Votee。」 Jacky希望能夠做到一些能夠落地,而且幫到社會的事業,尤其對數據、AI等方面感到興趣。

Pak在加拿大長大及求學,曾經擔任加拿大市長的助理,其後加入金融業,然後來到香港發展事業。「我是比較偏向理想主義者,希望透過初創公司為社會帶來影響力,我對金融、創新及法規方面有興趣。」Pak說。

Pak和Jacky於2013年共同創立Votee,最初的業務,是利用大數據作市場研究和社交媒體聆聽(Social Listening)。所謂Social Listening,就是要對市場情緒進行分析,了解市場上的評論傾向正面還是負面,但是所有事物並不是非黑即白,還有中性、正面含負面或者負面含正面,分類愈來愈多,Votee開始使用AI協助分析。

最初,兩人希望盡量避免搞AI,因為這門科技看似門檻很高,通常是博士才會研究。 Jacky說:「當客戶的問題出現廣東話,系統就立刻處理不了,我們總不能跟客人說交不了貨,唯有『馬死落地行』,自己動手做一個廣東話大模型。」 廣東話其實是「小語種」,像「疊水」這種地道的廣東話詞彙,主流模型可能會誤解,甚至產生完全錯誤的「幻覺」(Hallucination)。

網上的廣東話數據並不足夠,Votee使用合成技術,製造更多數據去訓練AI,包括進行角色扮演,例如菜販、唱作人等,設計了逾十萬種人格,處理多元化的語境,花了八個月時間,以大量人手整理和標籤資料,成功建立了專屬的廣東話LLM。

而Votee的模型因為深入理解廣東話的語境、文化及中英夾雜的習慣,能夠準確處理這些細微差別。 Votee於2018年開始研發人工智能,最初只是內部使用,後來發現可以幫到其他公司,從而變成一盤生意, 2021年接到首個來自金融業的客戶,並於2022年成立Votee AI。

Votee AI (圖片來源:被訪者提供)
(圖片來源:被訪者提供)

客戶主動找上門

Jacky說:「2023年,ChatGPT橫空出世,客戶不斷打電話來問我們是否在做ChatGPT,其實他們的意思是GenAI。一向是我們向客戶推銷,甚少客戶主動找上門來,這是一個很強的訊號,令我們覺得這方面的生意具有潛力。」 Votee AI的廣東話LLM,很快便在行內傳開,將其AI應用於各行各業,主要以商業對商業(B2B)模式服務客戶,涵蓋銀行、上市公司、監管機構、餐飲及零售等領域。

Pak透露:「金融業是我們最早切入的市場,因為他們對客戶服務的即時性和準確性要求極高。現在的應用已經超越了傳統的聊天機械人(Chatbot),進化成『AI代理』(AI Agent)或『智能體』。」 這些AI Agent不僅能進行語音和文字的即時對答,更能模擬真人溝通,處理更複雜的任務。 從語音識別(Speech to Text)、語音生成(Text to Speech)到無縫的語音對語音(Speech to Speech)溝通,Votee AI為企業客戶提供了更智能化和人性化的解決方案。

為填補全球在廣東話LLM評估領域的空白,引領香港AI技術走向國際,Votee AI研發了全球首個廣東話LLM評估基準「HKCanto-Eval」,並成功在全球頂尖的人工智能學術會議ACL 2025 CoNLL上發表。 Pak指出:「這份是全球第一份針對廣東話大模型的學術級評測基準。這意味著,當Google、OpenAI說它們的模型支援廣東話時,我們可以有一個客觀的標準去衡量『有多好』,證明我們的模型在理解和生成地道廣東話方面,達到了世界級水平。」

Votee AI觀察到,許多政府部門、研究機構甚至大企業都希望擁有自己的語言模型,以確保數據私隱和客製化需求,但卻因技術門檻高、成本如「無底深潭」而卻步。 Jacky說:「LLM本身是無極限,數據愈多,訓練出來的模型愈精準,所以IT人只會告訴你,無論數據或者晶片,數量都是愈多愈好,所以說是無底深潭;但即使你不介意燒錢,完成訓練後,可能大廠已推出更加超前的模型。」

Votee AI (圖片來源:被訪者提供)
(圖片來源:被訪者提供)

AI訓練AI

Votee AI即將推出革命性的B2D(Business to Developer)平台——「Votee AI Magic AI agent training platform」。 Jacky解釋說:「我們希望將訓練LLM普及化(democratize),這個平台的核心理念是『AI train AI』,利用AI代理團隊去自動化處理數據收集、清理、模型訓練到評估的絕大部分流程。」

用戶只需透過簡單的指令,平台就能生成整個訓練工作流程,當中有AI代理負責數據科學、語言模型,訓練師、評估師等;還有很多小代理進行規劃、檢測等工作。平台同時引入「預算控制」功能,讓企業能預估在特定預算下(例如10萬或20萬美元)可以訓練出甚麼效果的模型,徹底解決企業「燒錢」的憂慮。該平台支援雲端及本地部署,確保敏感資料毋需出境,目前已與政府部門進行洽談。

Votee AI以香港為基地,並且在越南建立團隊,協助研發產品;另外在加拿大亦有團隊,為當地客戶提供服務。除廣東話,Votee AI正著手開發印尼語的大模型,未來將會覆蓋更多東南亞、中亞甚至非洲的「Low-resource languages」(資源稀缺語言)。

Jacky說:「全球有超過6,000種語言,除了排名前十的主流語言外,其他都是一個龐大的、被忽略的市場。」 現時AI代理經已成為不少企業的虛擬員工,市場潛力無窮,Votee AI有望利用AI代理將LLM普及化,亦可以為公司賺取更多利潤。 Votee AI於2023年9月取得數碼港微型科技基金(CCMF),去年成為培育公司,為期兩年,可獲各方面的支援。 Votee AI目前正在進行A輪融資,資金將用於拓展海外市場及產品研發。

Votee AI (圖片來源:被訪者提供)
(圖片來源:被訪者提供)

資源稀缺語言

全球共有逾6,000種語言,網上最多數據的語言,依次是英文、德文、法文、波蘭文及日文等,中文排名12位,廣東話排名83位。 至於全球最多人使用的語言,依次是英文、中文、印度文、西班牙文及法文等,印尼文排第11位,廣東話排名20位。 Jacky說:「雖然很多人使用印度文,但是印度文分開不同分支,這些分支亦未必擁有足夠的資源。」

有人認為廣東話是方言,也有人認為是另外一種語言,這些需要由語言學家判斷,但無可否認的是,使用廣東話的群體有一定規模,全球約有8,300萬人。 Jacky說:「無論是內地的方言,或者東南亞、非洲的方言,都屬於資源稀缺語言,技術上可以做到LLM,但是未必可以商業化。」

圖片來源:被訪者提供