Contents

人工智慧正在為你的社群媒體數據而來:你能對此做些什麼嗎?

要點

儘管人們越來越擔心社群媒體平台上的用戶資訊隱私,但據報道,其中一些平台已將用戶資料的存取權限出售給人工智慧(AI)公司,以訓練其生成式人工智慧模型。這引發了有關此類行為的道德影響和潛在後果的問題。

據了解,Meta、Reddit、Tumblr 和 WordPress.com 等上述平台都參與了涉及​​人工智慧訓練目的資料授權的協議。

使用者可以採取一些適度的措施來保護自己的訊息,包括修改隱私偏好、拒絕分享以及在網路上發佈內容時保持謹慎。

近年來,社群媒體公司一直在探索透過與人工智慧公司簽訂協議來利用用戶資訊的新方法。然而,它提出了一個問題:普通個人可以採取哪些措施來保護他們的個人資料和數位創作不被此類交易所利用。

社群媒體平台與人工智慧公司達成交易

利用社群媒體資訊訓練人工智慧模型引起了相當大的爭論,但社群媒體公司似乎不願意放棄用戶資料。

Meta 已將社群媒體資料整合到其生成式人工智慧功能中,這些功能是在 Meta Connect 活動期間推出的。這些功能包括 Meta AI 和為 WhatsApp 等平台產生 AI 驅動的表情符號等功能。

如 Meta 產品管理總監 Mike Clark 在 Meta Newsroom 貼文 中所述:

我們最近的活動(稱為 Connect)中展示的功能中使用的人工智慧模型是使用 Instagram 和 Facebook 的公開內容(包括圖像和隨附的標題)進行訓練的。

根據路​​透社,這種趨勢似乎並沒有放緩-22/) ,Reddit 與Google 達成協議,讓該社群媒體平台的內容可用於訓練AI 模型。

Reddit 的 S-1 文件 於 2024 年 2 月 22 日提交,確認該公司探索許可交易。文件指出:

事實證明,Reddit 資料的利用對於當代人工智慧技術(包括大語言模型 (LLM))的發展至關重要。因此,我們預計 Reddit 廣泛的會話資訊和專業知識庫將繼續有助於完善和增強這些先進語言系統的能力。

Reddit 啟動了一項計劃,使外部實體能夠獲得從其平台存取、檢查和呈現過去和當前資料的許可,目的是利用這些資訊來增強大型語言模型 (LLM)。

儘管 Meta 和 Reddit 是社群媒體領域最知名的公司,但它們並不是唯一使用社群媒體資料訓練人工智慧的平台。根據 404 Media 的報導,Tumblr 和 WordPress.com 是準備將使用者資料出售給 Midjourney 和 OpenAI。

你能阻止平台出售你的社群媒體數據用於人工智慧培訓嗎?

利用 Facebook、Instagram、Reddit、Tumblr 和 WordPress.com 等平台可能會將一個人的公開存取內容納入語言模式學習者 (LLM) 的開發過程中。

例如,如果您使用華盛頓郵報的搜尋工具來查看Google的C4資料集中包含哪些網站,這是作為Bard 培訓的一部分,您會看到Reddit.com 擁有790 萬個代幣。

/bc/images/reddit-included-in-c4-dataset-search-results.png

該資料集包含相當多的內容來源,包括Tumblr.com(其大量代表約160 萬個代幣),以及較小的網站(例如我自己使用的WordPress.com),其貢獻量很小,僅約14,000 個代幣。值得注意的是,即使是這些不起眼的個人部落格也包含在資料集的範圍內。

人工智慧公司和社交網路實體之間的新興協議需要對此類數據進行主動行銷,而不是從線上資源中被動提取。

但是當涉及到未來的處理時,你能做什麼呢? Meta 推出了生成人工智慧資料主體權利表格,讓您可以反對或限制第三方處理您的個人資料以培訓 Meta生成式人工智慧模型。

值得注意的是,此選項不允許對 Meta 以訓練人工智慧系統為目的處理用戶資料提出異議。此外,當嘗試透過提供的表格提出異議時,我們發現,作為支持票流程的一部分,需要提供 Meta 人工智慧輸出中使用個人資訊的證據。

/bc/images/meta-support-response.png

Tumblr 提供了一種解決方案,使用戶能夠透過其帳戶配置拒絕將其公開部落格貼文傳播到外部實體。要存取此功能,請導航至您的個人資料頁面並向下捲動,直到找到「可見性」選項。從那裡,選擇防止未經授權與第三方共享您的部落格的替代方案。

/bc/images/prevent-third-part-sharing-on-tumblr-blog.png

使用 Instagram 等平台時,一種可能的策略是更改帳戶的隱私設定以限制可訪問性。雖然這項措施並不能絕對保證您的資訊不會被利用,但考慮到針對公開內容的資料收集做法盛行,切換到私人帳戶可能會產生強大的威懾力。

或者,您可以選擇將您的 Twitter 帳戶配置為私人帳戶。但要注意的是,該措施並不能為您的資料隱私保護提供絕對保證。

世界各地各國資訊專員和專家發表的聯合聲明也建議個人採取一些行動,以盡量減少人工智慧公司竊取資料的隱私風險。該建議包括:

請查看本網站的條款和條件以及隱私權政策,以了解其有關個人資料共享的做法。

在網路上分享個人資訊時,請務必保持謹慎和克制,尤其是在洩露敏感資料時。

⭐管理您的隱私設定。

在考慮選擇在網路上分享的內容時,重要的是要保持長遠的眼光,並仔細考慮此類揭露在近期和遙遠的將來的潛在影響。

如果您懷疑社交網路平台或網站未經適當授權就提取您的個人資訊,建議聯絡相應的服務提供者進行澄清。如果您對他們的答覆不滿意,請考慮向適當的資料保護機構提出申訴。

您可以選擇刪除第三方實體可能存取的特定數據,儘管您個人資料中公開發布的資訊可能已被其他人提取。

遺憾的是,一般使用者保護其資料免受人工智慧公司侵害的程度是有限的。對此問題的最終監督和權威可能需要監管機構的干預。