Contents

Bạn có nên sử dụng LLM địa phương? 9 ưu và nhược điểm

Bài học chính

Mặc dù các chatbot công cộng phải chịu một số hạn chế và ràng buộc nhất định về mặt kiểm duyệt nội dung, nhưng các mô hình ngôn ngữ địa phương mang lại mức độ tự chủ và linh hoạt cao hơn khi khám phá các chủ đề gây tranh cãi hoặc nhạy cảm, dẫn đến các cuộc đối thoại không bị ngăn cấm hơn.

Việc sử dụng Mô hình ngôn ngữ lớn (LLM) cục bộ có thể nâng cao quyền riêng tư dữ liệu vì nó lưu trữ tất cả thông tin được tạo cục bộ, từ đó bảo vệ tính bảo mật và hạn chế quyền truy cập vào các công ty vận hành LLM công cộng có thể sử dụng sai mục đích hoặc bán dữ liệu người dùng để kiếm lợi.

LLM cục bộ có thể được sử dụng ngoại tuyến để tạo điều kiện hoạt động liền mạch ở những khu vực có kết nối internet hạn chế hoặc không liên tục, cung cấp giải pháp thiết thực trong môi trường mà tài nguyên trực tuyến có thể không có sẵn.

Sự xuất hiện của ChatGPT vào tháng 11 năm 2022 đã dẫn đến việc áp dụng và phổ biến rộng rãi thuật ngữ “mô hình ngôn ngữ lớn” (LLM), vốn trước đây chỉ được những người đam mê AI biết đến như một thuật ngữ chuyên ngành. Một trong những điểm hấp dẫn chính của LLM địa phương nằm ở khả năng cung cấp chức năng tương tự như chức năng của chatbot dựa trên đám mây như ChatGPT, đồng thời loại bỏ nhu cầu về dịch vụ lưu trữ bên ngoài.

Câu hỏi về việc có nên sử dụng Mô hình ngôn ngữ lớn (LLM) được cài đặt cục bộ hay không đã được cả những người ủng hộ và những người gièm pha, với mỗi bên đưa ra những lập luận thuyết phục. Trong bài viết này, chúng tôi mong muốn cung cấp một phân tích khách quan bằng cách xem xét những ưu và nhược điểm của việc triển khai một hệ thống như vậy. Cuối cùng, điều cần thiết là phải xác định xem LLM địa phương có phù hợp với nhu cầu và mục tiêu cụ thể của một người hay không.

Ưu điểm của việc sử dụng LLM cục bộ

/vi/images/ai-brain-digital.jpg

Các cá nhân thường bày tỏ sự nhiệt tình lớn lao trong việc xây dựng các mô hình ngôn ngữ quy mô lớn được cá nhân hóa để hoạt động trên các thiết bị máy tính của họ. Những lý do đằng sau sự phấn khích này không chỉ đơn thuần là sự khoe khoang hay sự hấp dẫn thời thượng; tồn tại một số lợi ích hữu hình có thể bắt nguồn từ nỗ lực như vậy. Cần xem xét những lợi ích thiết thực này trước khi bắt tay vào nhiệm vụ xây dựng mô hình ngôn ngữ có thể tùy chỉnh.

Ít kiểm duyệt hơn

Khi ChatGPT và Bing AI lần đầu tiên đi vào hoạt động, khả năng nói và hành động của họ tỏ ra hấp dẫn và đáng lo ngại không kém. Bing AI thể hiện bầu không khí tình cảm và lòng tốt, gợi ý sự hiện diện của chiều sâu cảm xúc. Ngược lại, ChatGPT không phản đối việc sử dụng ngôn từ tục tĩu theo yêu cầu. Đáng chú ý, trong giai đoạn này, cả hai trí tuệ nhân tạo đều thể hiện sự sẵn sàng hỗ trợ chế tạo các thiết bị nổ thông qua sự thúc đẩy sáng suốt. Mặc dù những hành động như vậy có vẻ đáng nghi ngờ về mặt đạo đức, nhưng những sự kiện này đã minh họa cho tiềm năng to lớn vốn có trong khuôn khổ ngôn ngữ chi phối hoạt động của chúng.

Chatbots hiện phải tuân theo các quy định kiểm duyệt nghiêm ngặt, ngăn cản chúng cung cấp bất kỳ hỗ trợ nào trong việc viết tiểu thuyết tội phạm hư cấu có chứa hình ảnh bạo lực. Ngoài ra, một số chatbot AI không thảo luận về các chủ đề nhạy cảm như tôn giáo và chính trị. Tuy nhiên, việc cài đặt Mô hình ngôn ngữ lớn (LLM) cục bộ giúp người dùng có nhiều tự do hơn để khám phá các chủ đề gây tranh cãi mà không bị la mắng vì những hành vi thiếu thận trọng về mặt đạo đức. Điều này cho phép các cá nhân tham gia vào các cuộc trò chuyện về các vấn đề sở thích cá nhân mà không phải nhận những bài giảng mang tính phán xét từ robot.

Bảo mật dữ liệu tốt hơn

Các cá nhân thường chọn các mô hình ngôn ngữ lớn địa phương (LLM) vì chúng đảm bảo rằng mọi tương tác được thực hiện thông qua chúng đều được giữ bí mật và trong giới hạn thiết bị của họ. Việc sử dụng LLM cục bộ cũng tương tự như tổ chức một cuộc thảo luận riêng tư thoải mái tại nhà riêng của một người, trong đó không người ngoài nào có thể nghe lén. Điều này đúng cho dù bạn đang khám phá giới hạn thông tin thẻ tín dụng của mình hay tham gia vào các cuộc trò chuyện thân mật với LLM; tất cả dữ liệu được tạo vẫn được chứa độc quyền trong thiết bị của bạn. Ngược lại, việc sử dụng LLM có thể truy cập công khai như GPT-4 sẽ tiết lộ hồ sơ liên lạc của bạn cho các đơn vị giám sát kiểm soát các nền tảng này.

Sử dụng ngoại tuyến

Việc sử dụng mô hình ngôn ngữ địa phương (LLM) cho khả năng ngoại tuyến có thể không đáng kể khi xem xét tính khả dụng rộng rãi và khả năng truy cập dễ dàng của Internet. Tuy nhiên, tính năng này có thể đặc biệt quan trọng ở những khu vực có kết nối hạn chế hoặc rời rạc, vì nó cho phép người dùng vận hành hệ thống mà không cần kết nối trực tuyến đang hoạt động. Khả năng này đảm bảo rằng các tác vụ có thể được tiến hành liền mạch mà không có bất kỳ sự gián đoạn nào, điều này có thể rất có lợi trong những tình huống không đảm bảo được khả năng truy cập Internet đáng tin cậy.

Tiết kiệm chi phí

Việc truy cập các mô hình ngôn ngữ lớn hiện đại như GPT-4 và Claude 2 thường phải chịu phí hàng tháng khoảng 20 USD. Mặc dù điều này thoạt nhìn có vẻ hợp lý nhưng người dùng phải đối mặt với nhiều hạn chế khác nhau đối với khoản đầu tư của họ. Ví dụ: việc sử dụng GPT-4 thông qua ChatGPT sẽ giới hạn người dùng chỉ ở 50 tin nhắn trong khoảng thời gian ba giờ. Để vượt qua những hạn chế này, người ta sẽ cần nâng cấp lên gói ChatGPT Enterprise đắt tiền hơn, điều này có thể phải chịu thêm chi phí đáng kể. Ngược lại, việc sử dụng LLM được lắp đặt cục bộ sẽ loại bỏ yêu cầu đăng ký hoặc trả phí liên tục hàng tháng, giống như mua một chiếc xe thay vì dựa vào các dịch vụ vận chuyển chung. Bất chấp số tiền đầu tư ban đầu, về lâu dài

Tùy chỉnh tốt hơn

Hạn chế của các chatbot AI có thể truy cập công khai liên quan đến mức độ cá nhân hóa mà chúng cho phép, thường bị hạn chế bởi các cân nhắc liên quan đến quyền riêng tư và quy định nội dung. Bằng cách lưu trữ một người trợ giúp AI nội bộ, người dùng có thể điều chỉnh toàn bộ hệ thống để đáp ứng sở thích cá nhân của họ. Điều này cho phép đào tạo với thông tin độc quyền được thiết kế dành riêng cho các ứng dụng cụ thể của một người, từ đó nâng cao cả tính phù hợp và độ chính xác. Ví dụ: một chuyên gia pháp lý có thể cải tiến mô hình AI được bản địa hóa của họ để đưa ra lời khuyên pháp lý chính xác hơn nữa. Về cơ bản, lợi thế chính nằm ở khả năng tùy chỉnh theo các điều kiện tiên quyết riêng biệt của mỗi người.

Nhược điểm của việc sử dụng LLM cục bộ

/vi/images/chatgpt-and-child.jpg

Trước khi thực hiện chuyển đổi, điều cần thiết là phải lưu ý một số hạn chế nhất định liên quan đến việc sử dụng Mô hình ngôn ngữ lớn (LLM) cục bộ.

Nguồn lực chuyên sâu

Để đạt được hiệu suất tối ưu từ mô hình ngôn ngữ được thực thi cục bộ, bắt buộc phải có phần cứng hiệu suất cao như bộ xử lý trung tâm mạnh mẽ, lượng bộ nhớ truy cập ngẫu nhiên đáng kể và có thể là bộ xử lý đồ họa chuyên dụng. Mặc dù có thể sử dụng các cấu hình thấp hơn, chẳng hạn như cấu hình được tìm thấy trong các máy tính xách tay bình dân có giá khoảng 400 đô la, nhưng người dùng có thể đoán trước được kết quả dưới mức tối ưu, đặc biệt khi làm việc với các mẫu trí tuệ nhân tạo tiên tiến hơn. Sự tương tự này đúng với các tác vụ đòi hỏi tính toán chuyên sâu khác, chẳng hạn như chơi các trò chơi điện tử đòi hỏi khắt khe; tương tự, cần có các thông số kỹ thuật đầy đủ để mang lại kết quả khả quan. Trong một số trường hợp, các biện pháp bổ sung như hệ thống điều chỉnh nhiệt độ cũng có thể cần thiết. Cần lưu ý rằng việc vận hành mô hình ngôn ngữ địa phương đòi hỏi phải có cam kết tài chính đáng kể để đạt được sự đồng thuận của nhà nước.

Phản hồi chậm hơn và hiệu suất kém hơn

Một nhược điểm tiềm ẩn của LLM được triển khai cục bộ là thời gian phản hồi thường chậm hơn so với các LLM dựa trên internet. Tuy nhiên, sự khác biệt này có thể không nhất quán trong tất cả các trường hợp do các yếu tố như mô hình AI cụ thể và phần cứng được sử dụng. Mặc dù một số triển khai cục bộ nhất định có thể hoạt động đáng ngưỡng mộ nhưng phần lớn người dùng có thể gặp phải sự khác biệt đáng chú ý về khả năng phản hồi khi chuyển đổi giữa các nền tảng trực tuyến nhanh như chớp và LLM của riêng họ. Do đó, người dùng nên thận trọng dự đoán sự thay đổi đáng kể trong trải nghiệm người dùng, thường được gọi là “sự điều chỉnh văn hóa” khi di chuyển giữa hai lĩnh vực này.

Về bản chất, hiệu suất của mô hình ngôn ngữ lớn (LLM) được vận hành cục bộ sẽ không ngang bằng với hiệu suất của các chatbot AI tổng hợp trực tuyến, ngay cả khi một mô hình đó sở hữu cấu hình tiên tiến như AMD Ryzen 5800X3D kết hợp với Nvidia RTX 4090 và dung lượng RAM dồi dào.

Thiết lập phức tạp

Thiết lập Mô hình ngôn ngữ lớn (LLM) cục bộ có thể là một nhiệm vụ phức tạp hơn so với việc chỉ đăng ký dịch vụ Trí tuệ nhân tạo (AI) dựa trên web. Mặc dù kết nối Internet cho phép bạn nhanh chóng tạo tài khoản cho ChatGPT, Bard hoặc Bing AI, nhưng việc thiết lập môi trường LLM cục bộ hoàn chỉnh đòi hỏi phải tải xuống các khung cần thiết, định cấu hình cơ sở hạ tầng cần thiết và tích hợp một số thành phần. Mặc dù một số công cụ nhất định được thiết kế để hợp lý hóa quá trình cài đặt, việc thiết lập các mô hình lớn vẫn có thể đòi hỏi nỗ lực đáng kể, có thể mất vài giờ. Đáng chú ý là một số giải pháp AI tiên tiến tiếp tục đòi hỏi trình độ kỹ thuật đáng kể trước khi chúng có thể hoạt động hiệu quả trên hệ thống cục bộ. Do đó, trái ngược với sự dễ dàng sử dụng liên quan đến

Kiến thức hạn hẹp

Các Mô hình Ngôn ngữ Lớn được Bản địa hóa (LLM) thường thể hiện một hạn chế cố hữu về khả năng thu thập thông tin đương đại. Do thực tế là các mô hình này chủ yếu được đào tạo trên các tập dữ liệu chứa dữ liệu cho đến một ngày giới hạn cụ thể được xác định trước, nên chúng thường có nhận thức hạn chế về các sự kiện xảy ra sau thời điểm nói trên. Sự thiếu sót này gợi nhớ đến các phiên bản ChatGPT trước đó, không thể truy cập các nguồn thông tin bên ngoài và chỉ có thể đưa ra phản hồi liên quan đến các sự kiện diễn ra trước một thời điểm cụ thể.

Ngoài ra, LLM địa phương không thể truy cập dữ liệu internet trực tiếp. Điều này hạn chế tính hữu dụng của các truy vấn thời gian thực như giá cổ phiếu hoặc thời tiết. Để tận hưởng một dạng dữ liệu thời gian thực, các LLM địa phương thường sẽ yêu cầu một lớp tích hợp bổ sung với các dịch vụ được kết nối internet. Truy cập Internet là một trong những lý do bạn có thể cân nhắc nâng cấp lên ChatGPT Plus !

Bạn có nên sử dụng LLM cục bộ không?

Các mô hình ngôn ngữ lớn ở địa phương mang lại những lợi ích hấp dẫn nhưng cũng có những nhược điểm thực sự cần cân nhắc trước khi bắt đầu. Ít kiểm duyệt hơn, quyền riêng tư tốt hơn, truy cập ngoại tuyến, tiết kiệm chi phí và tùy chỉnh tạo nên một trường hợp hấp dẫn để thiết lập LLM cục bộ của bạn. Tuy nhiên, những lợi ích này phải trả giá. Với rất nhiều LLM có sẵn miễn phí trực tuyến, việc nhảy vào LLM địa phương có thể giống như đập ruồi bằng búa tạ – “có thể nhưng quá mức cần thiết. Nhưng hãy nhớ, nếu nó miễn phí thì bạn và dữ liệu bạn tạo ra có thể là sản phẩm. Vì vậy, ngày nay không có câu trả lời đúng hay sai dứt khoát. Việc đánh giá các ưu tiên của bạn sẽ xác định liệu bây giờ có phải là thời điểm thích hợp để thực hiện chuyển đổi hay không.