8 công cụ phát hiện văn bản AI chính xác nhất bạn có thể thử

Alicia Brunner included in Internet Artificial Intelligence Online Tools Website Lists

2023-09-18 2658 words 13 minutes

Contents

Khi các mô hình ngôn ngữ như GPT tiếp tục được cải tiến, việc phân biệt giữa văn bản do AI tạo ra và văn bản do con người viết ngày càng trở nên khó khăn hơn. Tuy nhiên, trong một số trường hợp, chẳng hạn như trong học thuật, cần phải đảm bảo rằng văn bản không được viết bởi AI.

Thật vậy, có nhiều công cụ phát hiện văn bản dựa trên trí tuệ nhân tạo khác nhau mang lại độ chính xác đáng kể trong việc xác định và gắn cờ nội dung đạo văn. Mặc dù không có công cụ nào như vậy đảm bảo độ chính xác hoàn hảo, nhưng một số công cụ trong số đó thể hiện sự thành thạo đáng chú ý trong lĩnh vực này. Với suy nghĩ này, chúng tôi đã biên soạn tuyển tập tám trình phát hiện văn bản AI có độ tin cậy cao để bạn nghiên cứu.

GPTZero

GPTZero được thiết kế như một công cụ để các nhà giáo dục xác định xem liệu bài tập mà học sinh của họ nộp có được tạo ra với sự hỗ trợ của trí tuệ nhân tạo hay không. Tuy nhiên, do GPTZero có thể xác định chính xác nội dung do ChatGPT sản xuất nên các cá nhân ngoài lĩnh vực học thuật cũng có thể thu được lợi ích từ việc sử dụng nội dung đó.

GPTZero tiến hành kiểm tra nội dung và xác định xem nó được tạo ra bởi con người hay trí tuệ nhân tạo, đồng thời xác định chính xác các đoạn văn cụ thể bị nghi ngờ là do AI tạo ra. Ngoài ra, công cụ này còn cung cấp xếp hạng về mức độ phức tạp và mức độ bùng nổ, giúp đánh giá mức độ khó dự đoán và biến động về mức độ khó dự đoán thường thấy trong các văn bản do con người soạn thảo, trái ngược với các văn bản do hệ thống AI tạo ra. Nhìn chung, điểm số phức tạp và bùng nổ có xu hướng tăng cao đối với văn bản do con người tạo ra và tương đối thấp hơn đối với nội dung được tạo ra bằng các phương tiện nhân tạo.

Để đánh giá hiệu quả của công cụ này, một tuyển tập từ Ngôi nhà của người lính của Ernest Hemingway đã được sử dụng cho mục đích thử nghiệm. Đầu ra do GPTZero cung cấp đã xác định chính xác nội dung do tác giả con người sáng tác và phân biệt thành công giữa văn bản do AI tạo ra bởi ChatGPT, phân loại nội dung đó là được sản xuất hoàn toàn thông qua các phương tiện nhân tạo.

Thật vậy, thử nghiệm của chúng tôi liên quan đến việc kết hợp một trích xuất bao gồm cả nội dung nhân tạo và nội dung do con người tạo ra. Đáng chú ý, GPTZero đã thể hiện sự thành thạo vượt trội trong việc xác định chính xác những đoạn văn do hệ thống AI tạo ra. Tuy nhiên, thật đáng tiếc là nó cũng đánh dấu nhầm một số phần do con người sáng tác.

GPTZero thể hiện sự thành thạo trong việc xác định văn bản được tạo giả tạo đồng thời mang lại kết quả tích cực giả. Nền tảng này cung cấp một phương pháp phù hợp để quét nhiều tệp bằng chức năng Tải lên tệp hàng loạt. Ngoài ra, có sẵn ba tùy chọn đăng ký-cấp miễn phí, cũng như hai cấp cao cấp có các chức năng mở rộng và ngưỡng công suất nâng cao.

Winston AI

Winston AI khẳng định mức độ thành thạo cao trong việc xác định nội dung được tạo giả tạo, tự hào với tỷ lệ chính xác được cho là 99,6%. Tuy nhiên, việc xác nhận những khẳng định như vậy nằm ngoài phạm vi của tuyên bố này. Tuy nhiên, trong quá trình đánh giá của chúng tôi, Winston AI đã thể hiện hiệu suất đáng khen ngợi.

Hệ thống đã phân loại chính xác “Ngôi nhà của người lính” của Ernest Hemingway là một tác phẩm hoàn toàn do con người sáng tác. Ngược lại, nó xác định các văn bản được tạo ra bởi trí tuệ nhân tạo là không có dấu vết về quyền tác giả của con người. Hơn nữa, nó đã xác định thành công khoảng 3/4 nội dung hỗn hợp bao gồm cả đầu vào của AI và con người mà chỉ có những sai sót nhỏ, quy kết chúng là do tác giả của con người.

Winston AI cung cấp đánh giá về khả năng đọc cũng như khả năng phát hiện các trường hợp đạo văn, mặc dù tính năng này chỉ có sẵn với các gói nâng cấp. Nền tảng này cung cấp bản dùng thử miễn phí có giới hạn lên tới 2000 từ, sau đó người dùng phải đăng ký đăng ký trả phí để tiếp tục sử dụng dịch vụ.

Trình phát hiện nội dung AI ở quy mô lớn

Nội dung ở quy mô, một nền tảng tạo văn bản AI tiên tiến, cho phép người dùng dễ dàng tạo ra tài liệu bằng văn bản phong phú chỉ bằng một vài đầu vào đơn giản. Ngoài trải nghiệm người dùng được sắp xếp hợp lý, công cụ cải tiến này còn tự hào có cơ chế phát hiện AI tiên tiến để nâng cao hiệu suất và độ chính xác.

Trình phát hiện AI quy mô cung cấp các đánh giá định lượng bao gồm khả năng về quyền tác giả, các mẫu rõ ràng và nội dung có thể dự đoán được, mỗi đánh giá được biểu thị dưới dạng phần trăm. Tỷ lệ phần trăm lớn hơn biểu thị khả năng có nguồn gốc con người tăng lên, trong khi các lối đi được gắn cờ gợi ý khả năng tạo ra nhân tạo.

Các thử nghiệm của chúng tôi đã chứng minh hiệu suất ấn tượng trong việc phát hiện nội dung do con người tạo ra với số điểm hoàn hảo là 100%, trong khi mang lại điểm tương đối thấp hơn cho các văn bản do ChatGPT tạo ra ở mức 16%. Điều thú vị là, phân tích kết hợp cả hai nguồn đã mang lại sự cải thiện đáng chú ý, đạt được độ chính xác phát hiện là 64%. Tuy nhiên, tương tự như các mô hình AI khác như GPTZero, thuật toán này cũng gặp phải trường hợp phân loại sai một số câu do con người tạo ra thành nội dung được tạo ra một cách giả tạo.

Ứng dụng phần mềm cụ thể này được cung cấp miễn phí và mang lại kết quả gần như tương đương với kết quả do GPTZero tạo ra.

AI độc đáo

AI độc đáo là một công cụ trí tuệ nhân tạo được đánh giá cao được thiết kế để xác định văn bản được tạo bằng GPT 3, GPT 3.5 và ChatGPT. Phần mềm tính toán điểm xác suất cho biết nội dung được tạo ra bởi con người hay được tạo ra thông qua tự động hóa, đồng thời thu hút sự chú ý đến những đoạn văn bị nghi ngờ là do máy tính tạo ra.

Phiên bản nâng cao của nền tảng AI nguyên bản, được chỉ định là Phiên bản 2.0, đã chứng tỏ khả năng thành thạo vượt trội trong việc xác định quyền tác giả của con người với tỷ lệ đánh giá 100%. Hơn nữa, khi đánh giá nội dung do ChatGPT tạo ra, hệ thống cho rằng nội dung đó hoàn toàn tổng hợp và quy cho trí tuệ nhân tạo với tỷ lệ 100%. Ngược lại, khi kiểm tra sự kết hợp giữa cả văn bản do con người và AI tạo ra, phân tích mang lại kết quả chỉ ra rằng khoảng 2/3 nội dung được tạo ra thông qua tự động hóa, trong khi 1/3 có nguồn gốc từ sự đóng góp của con người, dẫn đến phân loại tổng thể là 68% AI và 32% quyền tác giả của con người.

Không giống như nhiều tùy chọn thay thế cung cấp gói miễn phí, Originality AI hoạt động theo mô hình dựa trên đăng ký và yêu cầu thanh toán để sử dụng các dịch vụ của mình. Ngoài ra, mặc dù nó có khả năng phát hiện các trường hợp đạo văn trong tác phẩm đã gửi nhưng có thể phải trả phí bổ sung để truy cập tính năng này.

Trình phát hiện GPT Writefull

Để tạo điều kiện thuận lợi cho việc viết học thuật, Writefull sử dụng một loạt các tính năng dựa trên trí tuệ nhân tạo, trong số đó có máy dò GPT. Được cung cấp miễn phí, ứng dụng này cũng đảm bảo quyền riêng tư của người dùng bằng cách mã hóa tất cả dữ liệu được truyền qua nền tảng của nó.

Trình phát hiện GPT Writefull là một công cụ nâng cao có khả năng phát hiện và xác định nội dung được tạo bởi cả GPT-3 và ChatGPT. Thông qua phân tích kỹ lưỡng, trình phát hiện này đưa ra điểm số để định lượng khả năng văn bản nhất định được tạo ra bởi trí tuệ nhân tạo.

Trong các đánh giá của chúng tôi, Writefull đã chứng minh khả năng xác định văn bản do con người sáng tác, gán cho nó xác suất 1% cho thấy quyền tác giả tiềm năng là AI. Ngược lại, nó cho rằng 39% khả năng là do văn bản của ChatGPT. Hơn nữa, khi kết hợp các yếu tố tổng hợp liên quan đến cả AI và đầu vào của con người, Writefull đã phân loại thành phần này có xác suất 2% bắt nguồn từ GPT-3 hoặc ChatGPT.

Mặc dù Writefull thể hiện sự thành thạo trong việc xác định cả văn bản do con người tạo ra và do máy tạo ra, nhưng vẫn có sự khác biệt khi nội dung của con người và trí tuệ nhân tạo (AI) được trộn lẫn. Ứng dụng này kết hợp khả năng tương thích liền mạch với Microsoft Word và Overleaf, cùng với giao diện có thể lập trình cho GPT Detector.

Phát hiện văn bản kiểm duyệt Hive

Hive Moderation tự hào có cả một bộ máy để xác định văn bản được tạo nhân tạo và một công cụ để nhận dạng nội dung hình ảnh tổng hợp.

Phần mềm phân tích văn bản đã phân loại thành công nội dung văn bản do con người sáng tác là “không chứa bất kỳ văn bản nào do trí tuệ nhân tạo tạo ra”. Nó cũng dán nhãn chính xác cho văn bản do AI tạo ra. Tuy nhiên, tương tự như nhiều cách tiếp cận khác, nó gặp khó khăn trong việc xác định sự hiện diện của sự kết hợp của cả hai loại văn bản một cách chính xác.

Trang web cung cấp phiên bản demo sản phẩm của chúng tôi, phiên bản này không yêu cầu đăng ký và cung cấp quyền truy cập hạn chế. Tuy nhiên, để có được quyền truy cập đầy đủ, người dùng phải liên hệ trực tiếp với chúng tôi. Tính năng phát hiện hình ảnh của chúng tôi có khả năng xác định các bức ảnh được tạo bằng trí tuệ nhân tạo, chẳng hạn như những bức ảnh do DALL-E 2 hoặc Midjourney tạo ra.

Crossplag

Crossplag, giống như Plagscan, tự hào có hệ thống phát hiện dựa trên trí tuệ nhân tạo của riêng mình, hệ thống này đã thu hút được sự chú ý đáng kể của người dùng vì tính chính xác trong việc xác định nội dung được tạo ra thông qua tự động hóa. Nền tảng này có thiết kế thân thiện với người dùng, cho phép tích hợp liền mạch văn bản đã nhập để phân tích nhằm xác định xem nó có bắt nguồn từ nguồn AI hay không.

Ngoài việc xác định khả năng một đoạn văn nhất định được tạo ra bởi hệ thống trí tuệ nhân tạo, Crossplag còn xác định và tách biệt các cụm từ hoặc câu cụ thể trong văn bản được cho là được tạo ra thông qua các phương tiện tự động.

Khi thử nghiệm Crossplag, người ta nhận thấy rằng hệ thống đã phát hiện chính xác cả văn bản do ChatGPT tạo và nội dung do con người viết. Tuy nhiên, trong quá trình đánh giá một tài liệu chứa sự kết hợp của cả hai loại nội dung, công cụ này đã phân loại nhầm toàn bộ tài liệu là hoàn toàn do con người sáng tác thay vì quy bất kỳ phần nào cho việc tạo AI.

Crossplag cung cấp phiên bản miễn phí của trình kiểm tra đạo văn do AI cung cấp. Phiên bản này có thể được sử dụng mà không phải trả thêm phí, mặc dù người dùng có thể cần nâng cấp lên gói đăng ký cao cấp để truy cập vào các tính năng và chức năng nâng cao hơn liên quan đến trình phát hiện đạo văn của họ.

Trình phát hiện nội dung AI của Copyleaks

Copyleaks, một công cụ được đánh giá cao để xác định các trường hợp đạo văn, tự hào có một tính năng bổ sung được thiết kế để phát hiện việc sử dụng trái phép văn bản do AI tạo ra từ các nguồn như ChatGPT và GPT-3. Khía cạnh độc đáo của sản phẩm này nằm ở khả năng xác định nội dung được soạn bằng nhiều ngôn ngữ, bao gồm cả tiếng Tây Ban Nha và tiếng Pháp, khiến nội dung này trở nên khác biệt so với các đối thủ cạnh tranh.

Phần mềm đã thể hiện mức độ chính xác cao trong việc phân biệt giữa nội dung do con người tạo ra và nội dung do con người tạo ra. Nó xác định truyện ngắn của Ernest được viết bởi một tác giả con người với xác suất xấp xỉ 98,8%, đồng thời phát hiện văn bản do AI tạo ra với xác suất là 83,9%. Tuy nhiên, khi nói đến các tác phẩm hỗn hợp bao gồm cả yếu tố con người và máy móc tạo ra, đánh giá của nó tỏ ra kém tin cậy hơn, ước tính xác suất quyền tác giả của con người chỉ ở mức 67,2%.

Trình phát hiện nội dung AI do Copyleaks phát triển được trang bị tiện ích mở rộng Chrome tiện lợi, ngoài ra còn cung cấp khả năng tích hợp API và Hệ thống quản lý học tập (LMS) liền mạch để nâng cao trải nghiệm người dùng.

Phát hiện văn bản do AI tạo chỉ bằng một cú nhấp chuột

Sau khi liệt kê các công cụ nêu trên, người ta có thể dễ dàng xác định nội dung do AI tạo ra một cách dễ dàng. Tuy nhiên, độ chính xác của chúng vẫn còn thiếu sót đáng kể. Chỉ bằng cách thay đổi một số cụm từ, việc phá vỡ các cơ chế phát hiện này là khả thi. Hơn nữa, sự hạn chế đáng kể liên quan đến các tiện ích này bao gồm các quyết định sai lầm, có thể dẫn đến những cáo buộc không chính đáng hoặc nghi ngờ không đúng chỗ.

Mặc dù người ta có thể không muốn hoàn toàn phụ thuộc vào các chỉ số như vậy, nhưng có những dấu hiệu rõ ràng trong văn bản do AI tạo ra có thể được nhận biết khi xem xét kỹ lưỡng.