蘋果公司近日在其官方博客上深入分享了其在人工智能領(lǐng)域的隱私保護(hù)技術(shù)細(xì)節(jié),重點(diǎn)聚焦于差分隱私與合成數(shù)據(jù)在Apple Intelligence服務(wù)中的應(yīng)用。
差分隱私技術(shù)的運(yùn)用,為AI的進(jìn)化筑起了一道堅(jiān)實(shí)的隱私防線。以Genmoji表情生成為例,當(dāng)用戶選擇分享設(shè)備分析數(shù)據(jù)時(shí),系統(tǒng)并非簡(jiǎn)單收集所有指令,而是通過一種隨機(jī)噪聲算法,僅捕獲那些高頻出現(xiàn)的指令,如“戴著牛仔帽的恐龍”。個(gè)性化且低頻的指令則被排除在外,且所有收集的數(shù)據(jù)均與設(shè)備ID完全分離。這一機(jī)制確保了用戶隱私的同時(shí),也優(yōu)化了多實(shí)體組合表情的生成準(zhǔn)確性。設(shè)備端在提交數(shù)據(jù)時(shí),會(huì)隨機(jī)返回真實(shí)指令或干擾信號(hào),只有當(dāng)某條指令被大量設(shè)備同時(shí)提交時(shí),系統(tǒng)才會(huì)對(duì)其進(jìn)行識(shí)別,這一過程不涉及任何敏感信息的泄露。
面對(duì)長(zhǎng)文本處理的挑戰(zhàn),如郵件摘要功能,蘋果開發(fā)了一套獨(dú)特的合成數(shù)據(jù)解決方案。他們首先利用大型語言模型生成大量虛擬郵件,并將其轉(zhuǎn)換為包含主題和語言特征的數(shù)字向量。隨后,參與計(jì)劃的設(shè)備會(huì)在本地計(jì)算真實(shí)郵件的向量,并通過差分隱私技術(shù)匿名反饋與合成向量最為接近的類型。經(jīng)過多次迭代,系統(tǒng)能夠構(gòu)建出一個(gè)反映真實(shí)郵件分布規(guī)律的合成數(shù)據(jù)集,而無需接觸任何原始郵件內(nèi)容。這一技術(shù)已在郵件摘要功能的測(cè)試版中得到了驗(yàn)證,并計(jì)劃未來應(yīng)用于寫作助手等其他場(chǎng)景。
蘋果在博文中明確指出,Apple Intelligence服務(wù)的所有模型訓(xùn)練均使用去標(biāo)識(shí)化數(shù)據(jù),并在訓(xùn)練前嚴(yán)格過濾掉如社交安全號(hào)等敏感信息。這體現(xiàn)了蘋果在技術(shù)發(fā)展過程中,始終將用戶隱私放在首位的原則。
蘋果還透露,即將發(fā)布的iOS 18.5等系統(tǒng)中,差分隱私和合成數(shù)據(jù)技術(shù)將進(jìn)一步擴(kuò)展到Image Wand圖像處理、記憶相冊(cè)生成等十余項(xiàng)功能中。蘋果強(qiáng)調(diào),即使用戶參與設(shè)備分析計(jì)劃,其個(gè)人數(shù)據(jù)也始終在本地以加密形式存儲(chǔ),公司僅能獲取經(jīng)過數(shù)學(xué)驗(yàn)證的群體趨勢(shì)報(bào)告,從而確保用戶隱私的絕對(duì)安全。