AI กำลังมาสำหรับข้อมูลโซเชียลมีเดียของคุณ: คุณสามารถทำอะไรเกี่ยวกับมันได้หรือไม่?
ประเด็นที่สำคัญ
แม้ว่าจะมีความกังวลเพิ่มมากขึ้นเกี่ยวกับความเป็นส่วนตัวของข้อมูลผู้ใช้บนแพลตฟอร์มโซเชียลมีเดีย แต่ก็มีรายงานว่าแพลตฟอร์มเหล่านี้บางแห่งได้ขายการเข้าถึงข้อมูลผู้ใช้ให้กับบริษัทปัญญาประดิษฐ์ (AI) เพื่อฝึกอบรมโมเดล AI สร้างสรรค์ของพวกเขา สิ่งนี้ทำให้เกิดคำถามเกี่ยวกับผลกระทบทางจริยธรรมและผลที่ตามมาที่อาจเกิดขึ้นจากการกระทำดังกล่าว
แพลตฟอร์มดังกล่าวเช่น Meta, Reddit, Tumblr และ WordPress.com เป็นที่รู้กันว่ามีส่วนร่วมในข้อตกลงที่เกี่ยวข้องกับการออกใบอนุญาตข้อมูลเพื่อวัตถุประสงค์ในการฝึกอบรมปัญญาประดิษฐ์
ผู้ใช้อาจดำเนินการเล็กน้อยเพื่อปกป้องข้อมูลของตนโดยการปรับเปลี่ยนการตั้งค่าความเป็นส่วนตัว ปฏิเสธที่จะแบ่งปัน และใช้ความระมัดระวังเมื่อโพสต์เนื้อหาบนอินเทอร์เน็ต
ในช่วงไม่กี่ครั้งที่ผ่านมา บริษัทโซเชียลมีเดียได้สำรวจวิธีการใหม่ๆ ในการใช้ประโยชน์จากข้อมูลผู้ใช้โดยการทำข้อตกลงกับบริษัทปัญญาประดิษฐ์ อย่างไรก็ตาม ทำให้เกิดคำถามว่ามาตรการใดที่บุคคลทั่วไปสามารถนำมาใช้เพื่อปกป้องข้อมูลส่วนบุคคลและการสร้างสรรค์ดิจิทัลของตนจากการถูกนำไปใช้ประโยชน์ในธุรกรรมดังกล่าว
แพลตฟอร์มโซเชียลมีเดียเข้าถึงข้อตกลงกับบริษัท AI
การใช้ข้อมูลโซเชียลมีเดียเพื่อฝึกอบรมโมเดลปัญญาประดิษฐ์ทำให้เกิดการถกเถียงกันอย่างมาก แต่ปรากฏว่าบริษัทโซเชียลมีเดียไม่เต็มใจที่จะละทิ้งข้อมูลผู้ใช้
Meta ได้รวมข้อมูลโซเชียลมีเดียเข้ากับฟีเจอร์ AI ที่สร้างขึ้น ซึ่งเปิดตัวในระหว่างกิจกรรม Meta Connect คุณสมบัติเหล่านี้รวมถึง Meta AI และความสามารถ เช่น การสร้างอิโมจิที่ขับเคลื่อนด้วย AI สำหรับแพลตฟอร์ม เช่น WhatsApp
ดังที่ Mike Clark ผู้อำนวยการฝ่ายการจัดการผลิตภัณฑ์ที่ Meta กล่าวใน โพสต์ Meta Newsroom:
โมเดลปัญญาประดิษฐ์ที่ใช้ในฟีเจอร์ต่างๆ ที่แสดงในงานล่าสุดของเรา ซึ่งเรียกว่า Connect ได้รับการฝึกอบรมโดยใช้เนื้อหาที่เปิดเผยต่อสาธารณะทั้งจาก Instagram และ Facebook รวมถึงรูปภาพและคำบรรยายประกอบ
แนวโน้มนี้ดูเหมือนจะไม่ชะลอตัวลง ตามข้อมูลของ Reuters Reddit บรรลุข้อตกลงกับ Google เพื่อให้เนื้อหาของแพลตฟอร์มโซเชียลมีเดียพร้อมใช้งานสำหรับการฝึกโมเดล AI
การยื่น S-1 ของ Reddit สำหรับการเสนอขายหุ้น IPO ซึ่งยื่นเมื่อวันที่ 22 กุมภาพันธ์ 2024 ยืนยันว่าบริษัท สำรวจข้อเสนอใบอนุญาต การยื่นระบุว่า:
การใช้ข้อมูล Reddit ได้รับการพิสูจน์แล้วว่ามีความจำเป็นสำหรับการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ร่วมสมัย รวมถึงโมเดลภาษาขนาดใหญ่ (LLM) ด้วยเหตุนี้ เราคาดว่าพื้นที่เก็บข้อมูลการสนทนาและความเชี่ยวชาญที่กว้างขวางของ Reddit จะยังคงเป็นเครื่องมือในการปรับปรุงและเพิ่มขีดความสามารถของระบบภาษาขั้นสูงเหล่านี้
Reddit ได้ริเริ่มโปรแกรมที่ช่วยให้หน่วยงานภายนอกได้รับอนุญาตให้เข้าถึง ตรวจสอบ และนำเสนอข้อมูลทั้งในอดีตและปัจจุบันจากแพลตฟอร์ม โดยมีวัตถุประสงค์เพื่อใช้ข้อมูลนี้เพื่อปรับปรุงโมเดลภาษาขนาดใหญ่ (LLM)
แม้ว่า Meta และ Reddit จะเป็นชื่อที่โด่งดังที่สุดในโซเชียลมีเดีย แต่ก็ไม่ใช่แพลตฟอร์มเดียวที่เกี่ยวข้องกับการใช้ข้อมูลโซเชียลมีเดียเพื่อฝึก AI ตาม รายงานโดย 404 Media Tumblr และ WordPress.com เตรียมขายข้อมูลผู้ใช้ให้กับ Midjourney และ OpenAI
คุณสามารถหยุดแพลตฟอร์มไม่ให้ขายข้อมูลโซเชียลมีเดียของคุณสำหรับการฝึกอบรม AI ได้หรือไม่?
การใช้แพลตฟอร์ม เช่น Facebook, Instagram, Reddit, Tumblr และ WordPress.com อาจส่งผลให้เนื้อหาที่เข้าถึงได้แบบสาธารณะถูกรวมไว้ในกระบวนการพัฒนาของ Language Model Learners (LLM)
ตัวอย่างเช่น หากคุณใช้ เครื่องมือค้นหาของ Washington Post เพื่อดูว่าไซต์ใดรวมอยู่ในชุดข้อมูล C4 ของ Google ซึ่ง ใช้เป็นส่วนหนึ่งของการฝึกอบรมของ Bard คุณจะเห็นว่า Reddit.com คิดเป็น 7.9 ล้านโทเค็น
ชุดข้อมูลครอบคลุมแหล่งที่มาของเนื้อหาจำนวนมาก รวมถึง Tumblr.com ที่มีการนำเสนอโทเค็นประมาณ 1.6 ล้านโทเค็น เช่นเดียวกับเว็บไซต์ขนาดเล็ก เช่น เว็บไซต์ของฉันเองที่ใช้ WordPress.com ซึ่งมีส่วนร่วมน้อยที่สุดด้วยโทเค็นเพียงประมาณ 14,000 เท่านั้น เป็นที่น่าสังเกตว่าแม้แต่บล็อกส่วนตัวที่เรียบง่ายเหล่านี้ก็ยังรวมอยู่ในขอบเขตของชุดข้อมูล
ข้อตกลงที่เกิดขึ้นใหม่ระหว่างบริษัทปัญญาประดิษฐ์และหน่วยงานเครือข่ายทางสังคมเกี่ยวข้องกับการทำการตลาดเชิงรุกของข้อมูลดังกล่าว ซึ่งตรงข้ามกับการแยกข้อมูลแบบพาสซีฟจากแหล่งข้อมูลออนไลน์
แต่เมื่อพูดถึงการประมวลผลในอนาคต คุณสามารถทำอะไรได้บ้าง? Meta ได้แนะนำ แบบฟอร์มสำหรับสิทธิ์ของเจ้าของข้อมูล AI ทั่วไป ที่อนุญาตให้คุณคัดค้านหรือจำกัดการประมวลผลข้อมูลส่วนบุคคลของคุณจากบุคคลที่สามเพื่อฝึกอบรม Meta โมเดล AI เชิงสร้างสรรค์
เป็นที่น่าสังเกตว่าตัวเลือกนี้ไม่อนุญาตให้มีการคัดค้านการจัดการข้อมูลผู้ใช้ของ Meta เพื่อวัตถุประสงค์ในการฝึกอบรมระบบปัญญาประดิษฐ์ นอกจากนี้ เมื่อพยายามยื่นคำคัดค้านผ่านแบบฟอร์มที่ให้ไว้ พบว่าจำเป็นต้องมีหลักฐานของข้อมูลส่วนบุคคลของตนที่ถูกใช้ภายในเอาต์พุต AI ของ Meta ซึ่งเป็นส่วนหนึ่งของกระบวนการตั๋วสนับสนุน
Tumblr นำเสนอโซลูชั่นที่ช่วยให้ผู้ใช้สามารถปฏิเสธการเผยแพร่โพสต์บนบล็อกสาธารณะของตนไปยังหน่วยงานภายนอกผ่านการกำหนดค่าบัญชีของตน หากต้องการเข้าถึงคุณลักษณะนี้ ให้ไปที่หน้าโปรไฟล์ของคุณแล้วเลื่อนลงจนกว่าคุณจะพบตัวเลือก"การเปิดเผย"จากนั้นเลือกทางเลือกอื่นที่ป้องกันการแชร์บล็อกของคุณกับบุคคลที่สามโดยไม่ได้รับอนุญาต
เมื่อใช้แพลตฟอร์มเช่น Instagram กลยุทธ์หนึ่งที่เป็นไปได้คือเปลี่ยนการตั้งค่าความเป็นส่วนตัวของบัญชีของคุณเพื่อจำกัดการเข้าถึง แม้ว่ามาตรการนี้ไม่ได้ให้การรับประกันที่แน่นอนว่าข้อมูลของคุณจะไม่ถูกนำไปใช้ประโยชน์ แต่เมื่อพิจารณาถึงแนวทางปฏิบัติในการเก็บเกี่ยวข้อมูลที่แพร่หลายโดยมุ่งเป้าไปที่เนื้อหาที่เปิดเผยต่อสาธารณะ การเปลี่ยนไปใช้บัญชีส่วนตัวอาจเป็นอุปสรรคที่น่าเกรงขาม
หรือคุณสามารถเลือกที่จะกำหนดค่าบัญชี Twitter ของคุณให้เป็นส่วนตัวได้ อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่ามาตรการนี้ไม่ได้ให้การรับประกันการคุ้มครองความเป็นส่วนตัวสำหรับข้อมูลของคุณอย่างสมบูรณ์
คำแถลงร่วม โดยคณะกรรมการข้อมูลระดับชาติและผู้เชี่ยวชาญต่างๆ ทั่วโลก ยังได้แนะนำการดำเนินการบางอย่างสำหรับบุคคลที่ต้องการลดความเสี่ยงด้านความเป็นส่วนตัวจากการคัดลอกข้อมูลโดยบริษัท AI คำแนะนำประกอบด้วย:
โปรดตรวจสอบข้อกำหนดและเงื่อนไขตลอดจนนโยบายความเป็นส่วนตัวของเว็บไซต์นี้เพื่อทำความเข้าใจแนวทางปฏิบัติเกี่ยวกับการแบ่งปันข้อมูลส่วนบุคคล
เมื่อแบ่งปันข้อมูลส่วนบุคคลบนอินเทอร์เน็ต สิ่งสำคัญคือต้องใช้ความระมัดระวังและยับยั้งชั่งใจ โดยเฉพาะอย่างยิ่งเมื่อเปิดเผยข้อมูลที่ละเอียดอ่อน
⭐จัดการการตั้งค่าความเป็นส่วนตัวของคุณ
เมื่อพิจารณาเนื้อหาที่เราเลือกที่จะแบ่งปันบนอินเทอร์เน็ต สิ่งสำคัญคือต้องรักษามุมมองระยะยาว และพิจารณาอย่างรอบคอบถึงผลกระทบที่อาจเกิดขึ้นจากการเปิดเผยดังกล่าวทั้งในอนาคตอันใกล้และอนาคตอันไกลโพ้น
หากคุณสงสัยว่าข้อมูลส่วนบุคคลของคุณถูกดึงออกมาโดยไม่ได้รับอนุญาตอย่างเหมาะสมจากแพลตฟอร์มหรือไซต์เครือข่ายสังคมออนไลน์ ขอแนะนำให้ติดต่อผู้ให้บริการที่เกี่ยวข้องเพื่อขอคำชี้แจง ในกรณีที่คุณไม่พอใจกับคำตอบของพวกเขา ให้พิจารณาร้องทุกข์กับหน่วยงานคุ้มครองข้อมูลที่เหมาะสม
คุณมีทางเลือกในการลบข้อมูลเฉพาะที่หน่วยงานบุคคลที่สามอาจเข้าถึงได้ แม้ว่าข้อมูลที่โพสต์แบบสาธารณะในโปรไฟล์ของคุณอาจถูกผู้อื่นดึงออกมาแล้วก็ตาม
น่าเสียใจที่ขอบเขตที่ผู้ใช้ทั่วไปสามารถปกป้องข้อมูลของตนจากบริษัท AI นั้นนั้นมีจำกัด การกำกับดูแลและอำนาจสูงสุดในเรื่องนี้อาจจำเป็นต้องมีการแทรกแซงของหน่วยงานกำกับดูแล