AI

AI圖像生成工具訓練數據集中發現數百張兒童性虐待圖像

科技

廣告

斯坦福互聯網觀察研究員在本週早些時候發表的一項研究中表示,他們在一個用於訓練流行的AI圖像生成模型的大型公開數據集中,發現了超過一千張兒童性虐待材料的圖像。

AI模型訓練數據問題

這些圖像存在於訓練數據中,可能使AI模型更容易創建新的、逼真的AI生成的兒童虐待內容圖像,或者是兒童被剝削的“深偽”圖像。這些發現也引發了一系列新的疑慮,關於作為新一代強大生成AI工具基礎的訓練數據的不透明性。

LAION 5B數據集問題

斯坦福研究人員檢查的大型數據集,稱為LAION 5B,包含從互聯網(包括社交媒體和成人娛樂網站)抓取的數十億圖像。在數據集中的五十多億張圖像中,斯坦福研究人員表示,他們至少識別出1,008例兒童性虐待材料。