Contents

AI กำลังมาสำหรับข้อมูลโซเชียลมีเดียของคุณ: คุณสามารถทำอะไรเกี่ยวกับมันได้หรือไม่?

ประเด็นที่สำคัญ

แม้ว่าจะมีความกังวลเพิ่มมากขึ้นเกี่ยวกับความเป็นส่วนตัวของข้อมูลผู้ใช้บนแพลตฟอร์มโซเชียลมีเดีย แต่ก็มีรายงานว่าแพลตฟอร์มเหล่านี้บางแห่งได้ขายการเข้าถึงข้อมูลผู้ใช้ให้กับบริษัทปัญญาประดิษฐ์ (AI) เพื่อฝึกอบรมโมเดล AI สร้างสรรค์ของพวกเขา สิ่งนี้ทำให้เกิดคำถามเกี่ยวกับผลกระทบทางจริยธรรมและผลที่ตามมาที่อาจเกิดขึ้นจากการกระทำดังกล่าว

แพลตฟอร์มดังกล่าวเช่น Meta, Reddit, Tumblr และ WordPress.com เป็นที่รู้กันว่ามีส่วนร่วมในข้อตกลงที่เกี่ยวข้องกับการออกใบอนุญาตข้อมูลเพื่อวัตถุประสงค์ในการฝึกอบรมปัญญาประดิษฐ์

ผู้ใช้อาจดำเนินการเล็กน้อยเพื่อปกป้องข้อมูลของตนโดยการปรับเปลี่ยนการตั้งค่าความเป็นส่วนตัว ปฏิเสธที่จะแบ่งปัน และใช้ความระมัดระวังเมื่อโพสต์เนื้อหาบนอินเทอร์เน็ต

ในช่วงไม่กี่ครั้งที่ผ่านมา บริษัทโซเชียลมีเดียได้สำรวจวิธีการใหม่ๆ ในการใช้ประโยชน์จากข้อมูลผู้ใช้โดยการทำข้อตกลงกับบริษัทปัญญาประดิษฐ์ อย่างไรก็ตาม ทำให้เกิดคำถามว่ามาตรการใดที่บุคคลทั่วไปสามารถนำมาใช้เพื่อปกป้องข้อมูลส่วนบุคคลและการสร้างสรรค์ดิจิทัลของตนจากการถูกนำไปใช้ประโยชน์ในธุรกรรมดังกล่าว

แพลตฟอร์มโซเชียลมีเดียเข้าถึงข้อตกลงกับบริษัท AI

การใช้ข้อมูลโซเชียลมีเดียเพื่อฝึกอบรมโมเดลปัญญาประดิษฐ์ทำให้เกิดการถกเถียงกันอย่างมาก แต่ปรากฏว่าบริษัทโซเชียลมีเดียไม่เต็มใจที่จะละทิ้งข้อมูลผู้ใช้

Meta ได้รวมข้อมูลโซเชียลมีเดียเข้ากับฟีเจอร์ AI ที่สร้างขึ้น ซึ่งเปิดตัวในระหว่างกิจกรรม Meta Connect คุณสมบัติเหล่านี้รวมถึง Meta AI และความสามารถ เช่น การสร้างอิโมจิที่ขับเคลื่อนด้วย AI สำหรับแพลตฟอร์ม เช่น WhatsApp

ดังที่ Mike Clark ผู้อำนวยการฝ่ายการจัดการผลิตภัณฑ์ที่ Meta กล่าวใน โพสต์ Meta Newsroom:

โมเดลปัญญาประดิษฐ์ที่ใช้ในฟีเจอร์ต่างๆ ที่แสดงในงานล่าสุดของเรา ซึ่งเรียกว่า Connect ได้รับการฝึกอบรมโดยใช้เนื้อหาที่เปิดเผยต่อสาธารณะทั้งจาก Instagram และ Facebook รวมถึงรูปภาพและคำบรรยายประกอบ

แนวโน้มนี้ดูเหมือนจะไม่ชะลอตัวลง ตามข้อมูลของ Reuters Reddit บรรลุข้อตกลงกับ Google เพื่อให้เนื้อหาของแพลตฟอร์มโซเชียลมีเดียพร้อมใช้งานสำหรับการฝึกโมเดล AI

การยื่น S-1 ของ Reddit สำหรับการเสนอขายหุ้น IPO ซึ่งยื่นเมื่อวันที่ 22 กุมภาพันธ์ 2024 ยืนยันว่าบริษัท สำรวจข้อเสนอใบอนุญาต การยื่นระบุว่า:

การใช้ข้อมูล Reddit ได้รับการพิสูจน์แล้วว่ามีความจำเป็นสำหรับการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ร่วมสมัย รวมถึงโมเดลภาษาขนาดใหญ่ (LLM) ด้วยเหตุนี้ เราคาดว่าพื้นที่เก็บข้อมูลการสนทนาและความเชี่ยวชาญที่กว้างขวางของ Reddit จะยังคงเป็นเครื่องมือในการปรับปรุงและเพิ่มขีดความสามารถของระบบภาษาขั้นสูงเหล่านี้

Reddit ได้ริเริ่มโปรแกรมที่ช่วยให้หน่วยงานภายนอกได้รับอนุญาตให้เข้าถึง ตรวจสอบ และนำเสนอข้อมูลทั้งในอดีตและปัจจุบันจากแพลตฟอร์ม โดยมีวัตถุประสงค์เพื่อใช้ข้อมูลนี้เพื่อปรับปรุงโมเดลภาษาขนาดใหญ่ (LLM)

แม้ว่า Meta และ Reddit จะเป็นชื่อที่โด่งดังที่สุดในโซเชียลมีเดีย แต่ก็ไม่ใช่แพลตฟอร์มเดียวที่เกี่ยวข้องกับการใช้ข้อมูลโซเชียลมีเดียเพื่อฝึก AI ตาม รายงานโดย 404 Media Tumblr และ WordPress.com เตรียมขายข้อมูลผู้ใช้ให้กับ Midjourney และ OpenAI

คุณสามารถหยุดแพลตฟอร์มไม่ให้ขายข้อมูลโซเชียลมีเดียของคุณสำหรับการฝึกอบรม AI ได้หรือไม่?

การใช้แพลตฟอร์ม เช่น Facebook, Instagram, Reddit, Tumblr และ WordPress.com อาจส่งผลให้เนื้อหาที่เข้าถึงได้แบบสาธารณะถูกรวมไว้ในกระบวนการพัฒนาของ Language Model Learners (LLM)

ตัวอย่างเช่น หากคุณใช้ เครื่องมือค้นหาของ Washington Post เพื่อดูว่าไซต์ใดรวมอยู่ในชุดข้อมูล C4 ของ Google ซึ่ง ใช้เป็นส่วนหนึ่งของการฝึกอบรมของ Bard คุณจะเห็นว่า Reddit.com คิดเป็น 7.9 ล้านโทเค็น

/th/images/reddit-included-in-c4-dataset-search-results.png

ชุดข้อมูลครอบคลุมแหล่งที่มาของเนื้อหาจำนวนมาก รวมถึง Tumblr.com ที่มีการนำเสนอโทเค็นประมาณ 1.6 ล้านโทเค็น เช่นเดียวกับเว็บไซต์ขนาดเล็ก เช่น เว็บไซต์ของฉันเองที่ใช้ WordPress.com ซึ่งมีส่วนร่วมน้อยที่สุดด้วยโทเค็นเพียงประมาณ 14,000 เท่านั้น เป็นที่น่าสังเกตว่าแม้แต่บล็อกส่วนตัวที่เรียบง่ายเหล่านี้ก็ยังรวมอยู่ในขอบเขตของชุดข้อมูล

ข้อตกลงที่เกิดขึ้นใหม่ระหว่างบริษัทปัญญาประดิษฐ์และหน่วยงานเครือข่ายทางสังคมเกี่ยวข้องกับการทำการตลาดเชิงรุกของข้อมูลดังกล่าว ซึ่งตรงข้ามกับการแยกข้อมูลแบบพาสซีฟจากแหล่งข้อมูลออนไลน์

แต่เมื่อพูดถึงการประมวลผลในอนาคต คุณสามารถทำอะไรได้บ้าง? Meta ได้แนะนำ แบบฟอร์มสำหรับสิทธิ์ของเจ้าของข้อมูล AI ทั่วไป ที่อนุญาตให้คุณคัดค้านหรือจำกัดการประมวลผลข้อมูลส่วนบุคคลของคุณจากบุคคลที่สามเพื่อฝึกอบรม Meta โมเดล AI เชิงสร้างสรรค์

เป็นที่น่าสังเกตว่าตัวเลือกนี้ไม่อนุญาตให้มีการคัดค้านการจัดการข้อมูลผู้ใช้ของ Meta เพื่อวัตถุประสงค์ในการฝึกอบรมระบบปัญญาประดิษฐ์ นอกจากนี้ เมื่อพยายามยื่นคำคัดค้านผ่านแบบฟอร์มที่ให้ไว้ พบว่าจำเป็นต้องมีหลักฐานของข้อมูลส่วนบุคคลของตนที่ถูกใช้ภายในเอาต์พุต AI ของ Meta ซึ่งเป็นส่วนหนึ่งของกระบวนการตั๋วสนับสนุน

/th/images/meta-support-response.png

Tumblr นำเสนอโซลูชั่นที่ช่วยให้ผู้ใช้สามารถปฏิเสธการเผยแพร่โพสต์บนบล็อกสาธารณะของตนไปยังหน่วยงานภายนอกผ่านการกำหนดค่าบัญชีของตน หากต้องการเข้าถึงคุณลักษณะนี้ ให้ไปที่หน้าโปรไฟล์ของคุณแล้วเลื่อนลงจนกว่าคุณจะพบตัวเลือก"การเปิดเผย"จากนั้นเลือกทางเลือกอื่นที่ป้องกันการแชร์บล็อกของคุณกับบุคคลที่สามโดยไม่ได้รับอนุญาต

/th/images/prevent-third-part-sharing-on-tumblr-blog.png

เมื่อใช้แพลตฟอร์มเช่น Instagram กลยุทธ์หนึ่งที่เป็นไปได้คือเปลี่ยนการตั้งค่าความเป็นส่วนตัวของบัญชีของคุณเพื่อจำกัดการเข้าถึง แม้ว่ามาตรการนี้ไม่ได้ให้การรับประกันที่แน่นอนว่าข้อมูลของคุณจะไม่ถูกนำไปใช้ประโยชน์ แต่เมื่อพิจารณาถึงแนวทางปฏิบัติในการเก็บเกี่ยวข้อมูลที่แพร่หลายโดยมุ่งเป้าไปที่เนื้อหาที่เปิดเผยต่อสาธารณะ การเปลี่ยนไปใช้บัญชีส่วนตัวอาจเป็นอุปสรรคที่น่าเกรงขาม

หรือคุณสามารถเลือกที่จะกำหนดค่าบัญชี Twitter ของคุณให้เป็นส่วนตัวได้ อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่ามาตรการนี้ไม่ได้ให้การรับประกันการคุ้มครองความเป็นส่วนตัวสำหรับข้อมูลของคุณอย่างสมบูรณ์

คำแถลงร่วม โดยคณะกรรมการข้อมูลระดับชาติและผู้เชี่ยวชาญต่างๆ ทั่วโลก ยังได้แนะนำการดำเนินการบางอย่างสำหรับบุคคลที่ต้องการลดความเสี่ยงด้านความเป็นส่วนตัวจากการคัดลอกข้อมูลโดยบริษัท AI คำแนะนำประกอบด้วย:

โปรดตรวจสอบข้อกำหนดและเงื่อนไขตลอดจนนโยบายความเป็นส่วนตัวของเว็บไซต์นี้เพื่อทำความเข้าใจแนวทางปฏิบัติเกี่ยวกับการแบ่งปันข้อมูลส่วนบุคคล

เมื่อแบ่งปันข้อมูลส่วนบุคคลบนอินเทอร์เน็ต สิ่งสำคัญคือต้องใช้ความระมัดระวังและยับยั้งชั่งใจ โดยเฉพาะอย่างยิ่งเมื่อเปิดเผยข้อมูลที่ละเอียดอ่อน

⭐จัดการการตั้งค่าความเป็นส่วนตัวของคุณ

เมื่อพิจารณาเนื้อหาที่เราเลือกที่จะแบ่งปันบนอินเทอร์เน็ต สิ่งสำคัญคือต้องรักษามุมมองระยะยาว และพิจารณาอย่างรอบคอบถึงผลกระทบที่อาจเกิดขึ้นจากการเปิดเผยดังกล่าวทั้งในอนาคตอันใกล้และอนาคตอันไกลโพ้น

หากคุณสงสัยว่าข้อมูลส่วนบุคคลของคุณถูกดึงออกมาโดยไม่ได้รับอนุญาตอย่างเหมาะสมจากแพลตฟอร์มหรือไซต์เครือข่ายสังคมออนไลน์ ขอแนะนำให้ติดต่อผู้ให้บริการที่เกี่ยวข้องเพื่อขอคำชี้แจง ในกรณีที่คุณไม่พอใจกับคำตอบของพวกเขา ให้พิจารณาร้องทุกข์กับหน่วยงานคุ้มครองข้อมูลที่เหมาะสม

คุณมีทางเลือกในการลบข้อมูลเฉพาะที่หน่วยงานบุคคลที่สามอาจเข้าถึงได้ แม้ว่าข้อมูลที่โพสต์แบบสาธารณะในโปรไฟล์ของคุณอาจถูกผู้อื่นดึงออกมาแล้วก็ตาม

น่าเสียใจที่ขอบเขตที่ผู้ใช้ทั่วไปสามารถปกป้องข้อมูลของตนจากบริษัท AI นั้นนั้นมีจำกัด การกำกับดูแลและอำนาจสูงสุดในเรื่องนี้อาจจำเป็นต้องมีการแทรกแซงของหน่วยงานกำกับดูแล