Google鬥OpenAI 人工智能霸主之戰|封面故事

人工智能

廣告

OpenAI最近發布了新一代AI技術——GPT-4o,這款新模型不僅能夠處理文本,還能理解和生成音訊、視頻和圖像,更實現似人類般的互動,引起極度市場關注。另外,Google在美國時間上週二(5月14日)所舉行的2024年Google I/O大會,同樣推出多項創新AI產品。科技競賽一直都是一場長久戰,哪家公司能夠在技術創新上取得突破,開發出更先進、更高效的AI模型,將在競爭中佔據優勢。

OpenAI在少於30分鐘的發布會上,展示了ChatGPT的升級版本——GPT-4o模型。這個新模型最引人注目的特點,是其與用戶互動的「人性化」感覺。

GPT-4o可與用戶即時對話

該模型旨在提升多模態(multi-modal)處理和互動能力。這意味著GPT-4o不僅能夠理解和生成文本,還能處理和理解視訊、音訊等不同類型的資料。 GPT-4o可以與用戶即時對話,反應延遲約320毫秒,接近人類自然對話的速度。

用戶可以隨時打斷其發言,而ChatGPT在之後亦可以立即作出相對的反應,使得溝通的過程就像兩個人互動般。

另外,GPT-4o能夠自然且富有表現力地說話,甚至能夠在某些情況下顯得輕浮和幽默。它還能夠檢測使用者聲音中的情緒,並據此調整其反應。

圖片來源:patreon@EDfattogether