Contents

คุณควรใช้ LLM ท้องถิ่นหรือไม่? 9 ข้อดีและข้อเสีย

ประเด็นที่สำคัญ

แม้ว่าแชทบอทสาธารณะจะอยู่ภายใต้ข้อจำกัดและข้อจำกัดบางประการในแง่ของการกลั่นกรองเนื้อหา โมเดลภาษาท้องถิ่นจะให้ระดับความเป็นอิสระและความยืดหยุ่นที่มากขึ้น เมื่อเป็นเรื่องของการสำรวจประเด็นที่มีการโต้เถียงหรือละเอียดอ่อน ส่งผลให้บทสนทนาไม่ถูกขัดขวางมากขึ้น

การใช้โมเดลภาษาขนาดใหญ่ในท้องถิ่น (LLM) สามารถเพิ่มความเป็นส่วนตัวของข้อมูลได้ เนื่องจากจะจัดเก็บข้อมูลที่สร้างขึ้นทั้งหมดไว้ในเครื่อง ดังนั้นจึงป้องกันการรักษาความลับและจำกัดการเข้าถึงบริษัทที่ดำเนินงาน LLM สาธารณะที่อาจใช้ในทางที่ผิดหรือขายข้อมูลผู้ใช้เพื่อหาผลกำไร

LLM ในพื้นที่สามารถนำไปใช้แบบออฟไลน์ได้เพื่ออำนวยความสะดวกในการดำเนินงานที่ราบรื่นในภูมิภาคที่มีการเชื่อมต่ออินเทอร์เน็ตที่จำกัดหรือไม่สม่ำเสมอ โดยนำเสนอโซลูชันที่ใช้งานได้จริงในสภาพแวดล้อมที่ทรัพยากรออนไลน์อาจไม่พร้อมใช้งาน

การเกิดขึ้นของ ChatGPT ในเดือนพฤศจิกายน 2565 นำไปสู่การยอมรับและแพร่หลายของคำว่า “โมเดลภาษาขนาดใหญ่” (LLM) ซึ่งก่อนหน้านี้เป็นที่รู้จักในหมู่ผู้ที่ชื่นชอบ AI เท่านั้นว่าเป็นศัพท์เฉพาะทาง สิ่งที่น่าสนใจประการหนึ่งของ LLM ในท้องถิ่นอยู่ที่ความสามารถในการนำเสนอฟังก์ชันการทำงานที่คล้ายคลึงกับแชทบอทบนคลาวด์ เช่น ChatGPT ขณะเดียวกันก็ขจัดความจำเป็นในบริการโฮสติ้งภายนอก

คำถามที่ว่าจะใช้โมเดลภาษาขนาดใหญ่ (LLM) ที่ติดตั้งในเครื่องหรือไม่นั้นขึ้นอยู่กับทั้งผู้เสนอและผู้ว่า โดยแต่ละฝ่ายเสนอข้อโต้แย้งที่น่าสนใจ ในบทความนี้ เรามุ่งหวังที่จะให้การวิเคราะห์ตามวัตถุประสงค์โดยการตรวจสอบข้อดีและข้อเสียของการนำระบบดังกล่าวไปใช้ ท้ายที่สุดแล้ว จำเป็นต้องพิจารณาว่า LLM ในพื้นที่สอดคล้องกับความต้องการและวัตถุประสงค์เฉพาะของตนหรือไม่

ข้อดีของการใช้ LLM ท้องถิ่น

/th/images/ai-brain-digital.jpg

บุคคลต่างๆ มักแสดงความกระตือรือร้นอย่างมากในการสร้างแบบจำลองภาษาขนาดใหญ่ส่วนบุคคลเพื่อใช้งานบนอุปกรณ์คอมพิวเตอร์ของตน เหตุผลที่อยู่เบื้องหลังความตื่นเต้นนี้มีมากกว่าแค่การโอ้อวดหรือดึงดูดใจตามกระแส มีข้อได้เปรียบที่จับต้องได้หลายประการที่สามารถได้รับจากความพยายามดังกล่าว การพิจารณาประโยชน์เชิงปฏิบัติเหล่านี้ควรค่าแก่การพิจารณาก่อนที่จะเริ่มดำเนินการการสร้างแบบจำลองภาษาที่ปรับแต่งได้

เซ็นเซอร์น้อยลง

เมื่อ ChatGPT และ Bing AI เริ่มใช้งานได้ในตอนแรก ความสามารถในการพูดและการกระทำของทั้งสองก็ได้รับการพิสูจน์แล้วว่าน่าดึงดูดและน่าสับสนไม่แพ้กัน Bing AI แสดงออกถึงความรักและความเมตตา ซึ่งบ่งบอกถึงความลึกซึ้งทางอารมณ์ ในทางตรงกันข้าม ChatGPT ไม่รังเกียจที่จะใช้คำหยาบคายเมื่อมีการร้องขอ โดยเฉพาะอย่างยิ่งในช่วงเวลานี้ ปัญญาประดิษฐ์ทั้งสองแสดงให้เห็นถึงความพร้อมในการช่วยประดิษฐ์อุปกรณ์ระเบิดผ่านการเตือนที่รอบคอบ แม้ว่าการกระทำดังกล่าวอาจดูน่าสงสัยในเชิงจริยธรรม แต่เหตุการณ์เหล่านี้แสดงให้เห็นถึงศักยภาพอันมหาศาลที่มีอยู่ในกรอบงานทางภาษาที่ควบคุมการปฏิบัติงานของพวกเขา

ปัจจุบันแชทบอทอยู่ภายใต้กฎเกณฑ์การเซ็นเซอร์ที่เข้มงวด ซึ่งป้องกันไม่ให้พวกเขาให้ความช่วยเหลือใดๆ ในการเขียนนวนิยายอาชญากรรมสมมติที่มีภาพความรุนแรง นอกจากนี้ แชทบอท AI บางตัวจะไม่พูดคุยเรื่องที่ละเอียดอ่อน เช่น ศาสนา และการเมือง อย่างไรก็ตาม การติดตั้ง Large Language Models (LLM) ในเครื่องทำให้ผู้ใช้มีอิสระมากขึ้นในการสำรวจหัวข้อที่เป็นข้อขัดแย้ง โดยไม่ถูกดุว่าไม่เหมาะสมทางศีลธรรม สิ่งนี้ทำให้บุคคลสามารถมีส่วนร่วมในการสนทนาในเรื่องที่เป็นผลประโยชน์ส่วนบุคคลโดยไม่ต้องรับการบรรยายเชิงตัดสินจากหุ่นยนต์

ความเป็นส่วนตัวของข้อมูลที่ดีขึ้น

บุคคลมักเลือกโมเดลภาษาขนาดใหญ่ (LLM) ในท้องถิ่น เนื่องจากรับประกันว่าการโต้ตอบใดๆ ที่ดำเนินการผ่านโมเดลดังกล่าวจะยังคงเป็นความลับและอยู่ภายในขอบเขตของอุปกรณ์ของตน การใช้ LLM ในท้องถิ่นนั้นคล้ายคลึงกับการจัดการสนทนาส่วนตัวภายในบ้านที่สะดวกสบายของตนเอง โดยที่บุคคลภายนอกไม่สามารถแอบฟังได้ สิ่งนี้ถือเป็นจริงไม่ว่าคุณกำลังสำรวจขีดจำกัดของข้อมูลบัตรเครดิตของคุณหรือมีส่วนร่วมในการสนทนาอย่างใกล้ชิดกับ LLM ข้อมูลที่สร้างขึ้นทั้งหมดยังคงอยู่ในอุปกรณ์ของคุณโดยเฉพาะ ในทางตรงกันข้าม การใช้ LLM ที่เข้าถึงได้แบบสาธารณะ เช่น GPT-4 จะเปิดเผยบันทึกการสื่อสารของคุณแก่หน่วยงานกำกับดูแลที่ควบคุมแพลตฟอร์มเหล่านี้

การใช้งานออฟไลน์

การใช้โมเดลภาษาท้องถิ่น (LLM) สำหรับความสามารถแบบออฟไลน์อาจดูไม่มีนัยสำคัญเมื่อพิจารณาถึงความพร้อมใช้งานที่แพร่หลายและความสะดวกในการเข้าถึงอินเทอร์เน็ต อย่างไรก็ตาม คุณลักษณะนี้อาจมีความสำคัญอย่างยิ่งในพื้นที่ที่มีการเชื่อมต่อที่จำกัดหรือเป็นระยะๆ เนื่องจากจะทำให้ผู้ใช้สามารถใช้งานระบบได้โดยอิสระจากการเชื่อมต่อออนไลน์ที่ใช้งานอยู่ ความสามารถนี้ช่วยให้แน่ใจว่างานต่างๆ สามารถดำเนินไปได้อย่างราบรื่นโดยไม่มีการหยุดชะงัก ซึ่งอาจเป็นประโยชน์อย่างมากในสถานการณ์ที่ไม่รับประกันการเข้าถึงอินเทอร์เน็ตที่เชื่อถือได้

ประหยัดต้นทุน

การเข้าถึงโมเดลภาษาขนาดใหญ่ที่ล้ำสมัย เช่น GPT-4 และ Claude 2 โดยทั่วไปจะต้องเสียค่าธรรมเนียมรายเดือนประมาณ 20 ดอลลาร์ แม้ว่าสิ่งนี้อาจดูสมเหตุสมผลเมื่อมองแวบแรก แต่ผู้ใช้จะต้องต่อสู้กับข้อจำกัดต่างๆ ในการลงทุนของตน ตัวอย่างเช่น การใช้ GPT-4 ผ่าน ChatGPT จะจำกัดผู้ใช้ให้แสดงข้อความได้เพียง 50 ข้อความภายในระยะเวลาสามชั่วโมง เพื่อให้ก้าวข้ามข้อจำกัดเหล่านี้ เราจะต้องอัปเกรดเป็นแผน ChatGPT Enterprise ที่มีราคาแพงกว่า ซึ่งอาจมีค่าใช้จ่ายเพิ่มเติมจำนวนมาก ในทางตรงกันข้าม การใช้ LLM ที่ติดตั้งในพื้นที่ช่วยลดข้อกำหนดในการสมัครสมาชิกหรือค่าธรรมเนียมรายเดือนอย่างต่อเนื่อง ซึ่งเปรียบได้กับการซื้อยานพาหนะแทนที่จะพึ่งพาบริการขนส่งร่วม แม้จะต้องใช้เงินลงทุนเริ่มแรกในระยะยาว

การปรับแต่งที่ดีขึ้น

ข้อจำกัดของแชทบอท AI ที่เข้าถึงได้แบบสาธารณะนั้นเกี่ยวข้องกับขอบเขตของการตั้งค่าส่วนบุคคลที่พวกเขาอนุญาต ซึ่งมักจะถูกจำกัดโดยการพิจารณาที่เกี่ยวข้องกับความเป็นส่วนตัวและกฎระเบียบด้านเนื้อหา ด้วยการโฮสต์ผู้ช่วย AI ไว้ภายใน ผู้ใช้จะสามารถปรับแต่งระบบทั้งหมดให้ตรงตามความต้องการส่วนบุคคลได้ ช่วยให้สามารถฝึกอบรมด้วยข้อมูลพิเศษที่ออกแบบมาโดยเฉพาะสำหรับการใช้งานเฉพาะของตนเอง ซึ่งช่วยเพิ่มทั้งความตรงประเด็นและความแม่นยำ ตามภาพประกอบ ผู้เชี่ยวชาญด้านกฎหมายอาจปรับปรุงโมเดล AI ที่แปลเป็นภาษาท้องถิ่นของตนเพื่อให้คำแนะนำทางกฎหมายที่แม่นยำยิ่งขึ้น โดยพื้นฐานแล้ว ข้อได้เปรียบหลักอยู่ที่ความสามารถในการปรับแต่งตามข้อกำหนดเบื้องต้นเฉพาะของตนเอง

ข้อเสียของการใช้ LLM ท้องถิ่น

/th/images/chatgpt-and-child.jpg

ก่อนที่จะทำการเปลี่ยนแปลง จำเป็นอย่างยิ่งที่จะต้องคำนึงถึงข้อเสียบางประการที่เกี่ยวข้องกับการใช้ Local Large Language Model (LLM)

ทรัพยากรเข้มข้น

เพื่อให้บรรลุประสิทธิภาพสูงสุดจากโมเดลภาษาที่ดำเนินการในเครื่อง จำเป็นต้องมีฮาร์ดแวร์ประสิทธิภาพสูง เช่น หน่วยประมวลผลกลางที่แข็งแกร่ง หน่วยความจำเข้าถึงโดยสุ่มจำนวนมาก และอาจเป็นหน่วยประมวลผลกราฟิกเฉพาะ แม้ว่าจะเป็นไปได้ที่จะใช้การกำหนดค่าที่น้อยกว่า เช่นที่พบในแล็ปท็อปราคาประหยัดที่มีราคาประมาณ 400 ดอลลาร์ แต่ผู้ใช้สามารถคาดหวังผลลัพธ์ที่ต่ำกว่าปกติได้ โดยเฉพาะอย่างยิ่งเมื่อทำงานกับโมเดลปัญญาประดิษฐ์ขั้นสูงกว่า การเปรียบเทียบนี้ใช้ได้กับงานที่ต้องใช้การคำนวณสูงอื่นๆ เช่น การเล่นวิดีโอเกมที่มีความต้องการสูง ในทำนองเดียวกัน จำเป็นต้องมีข้อกำหนดเฉพาะที่เพียงพอเพื่อให้ได้ผลลัพธ์ที่น่าพึงพอใจ ในบางกรณีอาจจำเป็นต้องมีมาตรการเพิ่มเติม เช่น ระบบควบคุมอุณหภูมิด้วย ควรสังเกตว่าการดำเนินงานแบบจำลองภาษาท้องถิ่นจำเป็นต้องมีความมุ่งมั่นทางการเงินอย่างมากต่อการได้รับรัฐ

การตอบสนองช้าลงและประสิทธิภาพต่ำกว่า

ข้อเสียเปรียบที่อาจเกิดขึ้นของ LLM ที่ติดตั้งในเครื่องคือโดยทั่วไปแล้วเวลาตอบสนองจะช้ากว่าเมื่อเทียบกับบริษัทอื่นๆ ที่ทำงานบนอินเทอร์เน็ต อย่างไรก็ตาม ความคลาดเคลื่อนนี้อาจไม่สอดคล้องกันในทุกอินสแตนซ์ เนื่องจากปัจจัยต่างๆ เช่น โมเดล AI เฉพาะและฮาร์ดแวร์ที่ใช้ แม้ว่าการใช้งานในท้องถิ่นบางอย่างอาจมีประสิทธิภาพที่น่าชื่นชม แต่ผู้ใช้ส่วนใหญ่มีแนวโน้มที่จะพบกับความแตกต่างที่เห็นได้ชัดเจนในการตอบสนองเมื่อเปลี่ยนระหว่างแพลตฟอร์มออนไลน์ที่รวดเร็วปานสายฟ้ากับ LLM ของตนเอง ดังนั้น จึงควรระมัดระวังสำหรับผู้ใช้ในการคาดการณ์ประสบการณ์ผู้ใช้ที่แตกต่างกันอย่างมาก ซึ่งมักเรียกว่า"การปรับตัวทางวัฒนธรรม"เมื่อต้องเคลื่อนที่ไปมาระหว่างสองอาณาจักรนี้

โดยพื้นฐานแล้ว ประสิทธิภาพของโมเดลภาษาขนาดใหญ่ (LLM) ที่ดำเนินการในท้องถิ่นจะไม่ทัดเทียมกับแชทบอท AI ทั่วไปทางออนไลน์ แม้ว่าจะมีการกำหนดค่าที่ล้ำสมัย เช่น AMD Ryzen 5800X3D ที่จับคู่กับ Nvidia RTX 4090 และ ความจุ RAM เพียงพอ

การตั้งค่าที่ซับซ้อน

การตั้งค่าโมเดลภาษาขนาดใหญ่ (LLM) ในท้องถิ่นอาจเป็นงานที่ซับซ้อนกว่าเมื่อเปรียบเทียบกับการลงทะเบียนบริการปัญญาประดิษฐ์ (AI) บนเว็บ แม้ว่าการเชื่อมต่ออินเทอร์เน็ตจะทำให้คุณสามารถสร้างบัญชีสำหรับ ChatGPT, Bard หรือ Bing AI ได้อย่างรวดเร็ว แต่การสร้างสภาพแวดล้อม LLM ภายในเครื่องที่สมบูรณ์นั้นจำเป็นต้องดาวน์โหลดเฟรมเวิร์กที่จำเป็น การกำหนดค่าโครงสร้างพื้นฐานที่จำเป็น และการรวมองค์ประกอบต่างๆ เข้าด้วยกัน แม้ว่าเครื่องมือบางอย่างได้รับการออกแบบมาเพื่อปรับปรุงกระบวนการติดตั้ง แต่การตั้งค่าโมเดลขนาดใหญ่อาจยังต้องใช้ความพยายามอย่างมาก ซึ่งอาจใช้เวลาหลายชั่วโมง เป็นที่น่าสังเกตว่าโซลูชัน AI ที่ล้ำสมัยบางส่วนยังคงจำเป็นต้องใช้ความสามารถทางเทคนิคที่สำคัญก่อนที่จะสามารถทำงานได้อย่างมีประสิทธิภาพบนระบบภายในเครื่อง ส่งผลให้เมื่อเทียบกับความสะดวกในการใช้งานที่เกี่ยวข้อง

ความรู้มีจำกัด

โมเดลภาษาขนาดใหญ่ที่แปลเป็นภาษาท้องถิ่น (LLM) มักแสดงข้อจำกัดโดยธรรมชาติในความสามารถในการรับข้อมูลร่วมสมัย เนื่องจากข้อเท็จจริงที่ว่าแบบจำลองเหล่านี้ได้รับการฝึกฝนเป็นหลักเกี่ยวกับชุดข้อมูลที่มีข้อมูลจนถึงวันที่ตัดออกที่กำหนดไว้ล่วงหน้าโดยเฉพาะ แบบจำลองเหล่านี้จึงมักมีการรับรู้ที่จำกัดของเหตุการณ์ที่เกิดขึ้นภายหลังช่วงหัวเลี้ยวหัวต่อดังกล่าว ข้อบกพร่องนี้ชวนให้นึกถึง ChatGPT ที่เกิดขึ้นก่อนหน้านี้ ซึ่งไม่สามารถเข้าถึงแหล่งข้อมูลภายนอกได้ และทำได้เพียงให้คำตอบเกี่ยวกับเหตุการณ์ที่เกิดขึ้นก่อนจุดเวลาใดจุดหนึ่งเท่านั้น

นอกจากนี้ LLM ในพื้นที่ไม่สามารถเข้าถึงข้อมูลอินเทอร์เน็ตสดได้ ซึ่งจะจำกัดประโยชน์สำหรับการสืบค้นแบบเรียลไทม์ เช่น ราคาหุ้นหรือสภาพอากาศ หากต้องการเพลิดเพลินกับรูปลักษณ์ของข้อมูลแบบเรียลไทม์ โดยทั่วไป LLM ในพื้นที่จะต้องมีการผสานรวมเพิ่มเติมกับบริการที่เชื่อมต่ออินเทอร์เน็ต การเข้าถึงอินเทอร์เน็ตเป็นหนึ่งในเหตุผลที่คุณอาจพิจารณาอัปเกรดเป็น ChatGPT Plus !

คุณควรใช้ LLM ท้องถิ่นหรือไม่

โมเดลภาษาท้องถิ่นขนาดใหญ่ให้ประโยชน์ที่น่าดึงดูด แต่ก็มีข้อเสียที่ต้องพิจารณาก่อนที่จะตัดสินใจดำเนินการ การเซ็นเซอร์น้อยลง ความเป็นส่วนตัวที่ดีขึ้น การเข้าถึงแบบออฟไลน์ การประหยัดต้นทุน และการปรับแต่ง ถือเป็นกรณีที่น่าสนใจสำหรับการตั้งค่า LLM ของคุณในพื้นที่ อย่างไรก็ตาม สิทธิประโยชน์เหล่านี้ต้องแลกมาด้วยราคา เนื่องจากมี LLM ที่เปิดให้ใช้งานฟรีมากมายทางออนไลน์ การกระโดดเข้าสู่ LLM ในท้องถิ่นอาจเหมือนกับการตีแมลงวันด้วยค้อนขนาดใหญ่€ “เป็นไปได้แต่ต้องใช้กำลังมากเกินไป แต่จำไว้ว่าหากใช้งานได้ฟรี คุณและข้อมูลที่คุณสร้างก็มีแนวโน้มจะเป็นผลิตภัณฑ์นั้น ดังนั้นจึงไม่มีคำตอบที่แน่ชัดว่าถูกหรือผิดในวันนี้ การประเมินลำดับความสำคัญของคุณจะเป็นตัวกำหนดว่าตอนนี้เป็นเวลาที่เหมาะสมในการเปลี่ยนหรือไม่