주요 시사점
ChatGPT 탐지 도구는 교육자와 감독자가 인공지능 기술을 사용하여 진짜와 인위적으로 생성된 콘텐츠를 구분할 수 있는 수단을 제공함으로써 이러한 자료가 무단으로 또는 기만적인 방식으로 활용될 수 있는 사례를 탐지하는 능력을 향상시킵니다.
다양한 GPT 기반 탐지 시스템이 존재하지만, 오탐지 발생률이 높아 항상 신뢰할 수 있는 결과를 제공하지 못할 수 있으며, 이는 잠재적으로 부당한 학업 부정행위 혐의를 초래할 수 있습니다.
GPT 또는 이와 유사한 인공지능이 생성한 콘텐츠를 식별하는 데 있어 완전히 완벽한 방법을 보장하는 것은 불가능하지만, 이는 이러한 도구의 고유한 특성 때문일 수 있습니다.
ChatGPT가 점점 더 정교해짐에 따라 특정 텍스트가 사람이 작성한 것인지 AI 시스템이 생성한 것인지 구분하기가 어려워지고 있습니다. 따라서 교육자와 감독자 모두 어떤 작품이 인간의 창의성의 결과물이고 어떤 작품이 ChatGPT에 의해 생성되었는지 판단하는 데 어려움을 겪으면서 두 가지를 구별하는 것이 어려워졌습니다.
진위 여부를 판별하는 데 어려움을 겪고 있는 분들을 위해 현재 사용 가능한 가장 신뢰할 수 있는 ChatGPT 탐지 도구 목록을 정리해 보았습니다.
각 ChatGPT 검사 도구를 테스트한 방법
수많은 ChatGPT 작성 평가 도구가 존재하지만, 그 효율성이 크게 다르다는 것은 분명합니다. 일부 AI 시스템은 ChatGPT로 생성된 작문을 감지하는 데 탁월한 반면, 다른 AI 도구는 인위적으로 제작된 상업용 콘텐츠를 식별하는 데 우수할 수 있습니다. 반대로 특정 ChatGPT 검사기는 두 영역 모두에서 부족합니다.
다양한 ChatGPT 검사 도구의 성능을 평가하기 위해 이러한 시스템을 통해 다양한 텍스트를 처리하고 각각의 점수를 문서화할 것입니다. 이를 위해 테스트를 위해 여러 샘플을 선택했습니다:
⭐ 교사의 경우 ChatGPT 3.5 및 ChatGPT 4 으로 생성된 조지 워싱턴에 대한 짧은 에세이가 있습니다.
⭐ 상사를 위해 ChatGPT 3.5 및 ChatGPT 4 이 생성한 뉴스 작가 직업에 대한 커버 레터가 있습니다.
전적으로 손으로 쓴 제 글은 제로 폰트 전략의 복잡성을 탐구합니다.
⭐ 동일한 제로 폰트 기사 , 하지만 처음 세 단락은 ChatGPT가 다시 작성했습니다. 후자의 세 단락은 여전히 사람이 작성했습니다.
개별 문서를 평가할 때 ChatGPT 감지기는 “90% AI”와 같이 백분율로 표시된 점수를 제공합니다.이 비율은 콘텐츠가 인간 작가에 의해 작성된 것과 인공지능에 의해 작성된 것 중 어느 정도인지를 나타내는 것이 아니라, 인공지능이 콘텐츠 구성을 담당했을 가능성을 나타낸다는 점에 유의해야 합니다.
ChatGPT 탐지기의 유효성을 검증하기 위해 ChatGPT 3.5와 ChatGPT 4 콘텐츠를 모두 입력했을 때 높은 AI 점수를 획득하는 것을 목표로 하고 있습니다. 그럼에도 불구하고 동일한 탐지기가 사람이 생성한 텍스트에 대해서는 상대적으로 낮은 점수를, AI와 사람의 협업이 포함된 이중 언어 구성에 대해서는 중간 정도의 점수를 표시하는 것이 필수적입니다. 이는 잠재적인 오분류 또는 비정상적인 평가를 방지하는 역할을 합니다.
사용 가능한 몇 가지 ChatGPT 검증기를 살펴봄으로써 테스트 환경을 활용해 보겠습니다.
인공 지능 탐지기는 매우 신뢰할 수 있는 것처럼 보일 수 있지만, 그 평가에만 의존해서는 안 됩니다. 이러한 도구는 사람이 만든 콘텐츠를 AI가 생성한 것으로 잘못 분류할 수 있으며, 그 반대의 경우도 마찬가지입니다. 따라서 이러한 도구는 결정적인 증거로 간주하기보다는 광범위한 조사에서 하나의 구성 요소로만 사용해야 합니다.
GPTZero
GPTZero는 ChatGPT 성능을 평가할 수 있는 합리적인 대안을 제시합니다. 이전 논의에서 그 활용에 대해 간략히 설명했으며, 인공 언어 생성 감지에 관심이 있는 사람들에게 여전히 적합한 선택입니다.
무료 온라인 서비스에 액세스하려면 등록이 필요하지 않으며 각각 최대 5,000자를 포함하는 최대 7개의 구절을 스캔할 수 있습니다. 무료 계정으로 로그인하면 5,000자 범위 내에서 월 10,000단어까지 스캔할 수 있습니다.
실제로 GPTZero는 혁신적인 문서 스캔 기능을 통합하여 사용자가 직접 파일을 제출하여 심사할 수 있으므로 수동으로 복사하여 붙여넣을 필요가 없습니다. 넉넉한 무료 플랜을 통해 고객은 AI 호환성 검사를 위해 최대 3개의 문서를 동시에 제출할 수 있습니다.
GPTZero의 향상된 기능을 원하는 경우 프리미엄 플랜을 사용할 수 있습니다. 가장 저렴한 옵션은 10달러로 매월 최대 150,000개의 단어를 분석할 수 있으며, 단독 평가 시 최대 50,000개의 단어를 처리할 수 있는 용량을 제공합니다. 또한 이 요금제를 사용하면 한 번의 일괄 전송으로 최대 10개의 문서를 제출할 수 있습니다.
GPTZero로 실험한 결과 매우 고무적인 결과를 얻었습니다.이 시스템은 인공적으로 생성된 콘텐츠에 대해서는 높은 AI 신뢰도 점수를, AI와 사람의 입력이 결합된 구성에 대해서는 중간 등급을, 사람이 직접 구성한 자료에 대해서는 낮은 점수를 제공하는 등 뛰어난 성능을 보여주었습니다. 이러한 균형 잡힌 결과물은 GPTZero가 비용 효율성과 신뢰할 수 있는 성능을 효과적으로 결합했음을 시사합니다.
텍스트 출처 | 시험에 사용된 기사 | AI 신뢰도 |
---|---|---|
AI 생성 텍스트(높은 %가 더 좋음) | ChatGPT 3.5 에세이 | 83% AI |
ChatGPT 4 에세이 | 100% AI | |
ChatGPT 3.5 자기소개서 | 80% AI | |
ChatGPT 4 자기소개서 | 92% AI | |
Half-AI Half-Human (~50% Is Better) | Zero-Font Article With AI | 41% AI |
Human-.서면 텍스트 (낮은 %가 더 좋음) | 제로 글꼴 기사 | 11% AI |
Sapling AI 검출기
Sapling AI 센서의 무료 반복을 통해 사용자는 최대 2,000자를 평가할 수 있으며 최대 20개의 검사를 수행할 수 있습니다. 더 확장된 분석 범위를 원하는 경우, 월 25달러의 비용으로 8,000자로 글자 수 제한을 확장하고 무제한으로 평가할 수 있는 프로페셔널 플랜을 30일 평가판 기간과 함께 구독할 수 있습니다.
Sapling은 콘텐츠 검토 프로세스를 간소화하여 사용자 경험을 향상하도록 설계된 다양한 플러그인을 제공합니다. 이 플랫폼의 브라우저 확장 프로그램은 웹 브라우저에서 직접 Sapling을 활용하고자 하는 사용자들에게 특히 인기가 있습니다. 또한 구글 문서, 마이크로소프트 워드, 마이크로소프트 아웃룩과 같은 인기 플랫폼 전용 플러그인이 있어 사용자가 스캔 과정에서 애플리케이션을 전환할 필요가 없습니다. 이러한 원활한 통합 덕분에 사용자가 워크플로우의 어느 위치에 있든 항상 Sapling에 액세스할 수 있습니다.
AI 스캐너로서의 기능 외에도 Sapling은 사용자가 텍스트가 올바른 영어 문법을 준수하는지 확인하는 동시에 동일한 플랫폼 내에서 인공 지능 구성 요소를 확인할 수 있는 다국어 작성 도구를 제공합니다.
새플링은 ChatGPT 스캔의 모든 인스턴스를 100% 확실하게 감지하는 흔들림 없는 성능을 보여주었습니다.반면, 사람이 생성한 콘텐츠를 식별하는 정확도는 69.6%에 불과해 상대적으로 낮은 것으로 나타났으며, AI와 사람의 협업이 모두 포함된 기사에서는 100%의 완벽한 결과를 달성해 만점을 유지했습니다. 결과적으로 새플링은 업계에서 사용 가능한 다른 대안에 비해 높은 수준의 열정을 보여줍니다.
텍스트 출처 | 시험에 사용된 기사 | AI 신뢰도 등급 |
---|---|---|
AI 생성 텍스트 | ChatGPT 3.5 에세이 | 100% AI |
ChatGPT 4 에세이 | 100% AI | |
ChatGPT 3.5 자기소개서 | 100% AI | |
ChatGPT 4 자기소개서 | 100% AI | |
Half-AI Half-.인간 (~50% 더 좋음) | 제로 글꼴 문서 | 100% AI |
인간 작성 텍스트 (낮은 % 더 좋음) | 제로 글꼴 문서 | 69.6% AI |
윈스턴
프리미엄 요금제에 가입하거나 Chrome 확장 프로그램을 설치하면 추가로 10,000 크레딧을 받을 수 있습니다.
Winston은 월 $12의 프리미엄 서비스 요금제에 가입하면 다양한 최첨단 기능을 제공합니다. 이러한 요금제에는 최대 80,000단어의 포괄적인 스캔, 텍스트가 포함된 이미지를 분석하는 광학 문자 인식(OCR) 기능, 상세한 보고서를 생성하는 PDF 생성 도구가 포함되어 있습니다.
이번 테스트는 다소 양극화된 평가를 내렸는데, 이는 윈스턴이 콘텐츠에 명백한 인공 지능이 있거나 인공 지능이 없다고 단정적으로 선언한 데서 알 수 있듯이 다소 양극화된 평가가 나왔습니다. 그럼에도 불구하고 인간과 인공 지능의 교차점에 관한 문제의 기사를 평가할 때는 보다 균형 잡힌 결과가 나왔습니다.
텍스트 출처 | 시험에 사용된 기사 | AI 신뢰도 등급 |
---|---|---|
AI 생성 텍스트(높은 %일수록 좋음) | ChatGPT 3.5 에세이 | 100% AI |
ChatGPT 4 에세이 | 100% AI | |
ChatGPT 3.5 자기소개서 | 100% AI | |
ChatGPT 4 자기소개서 | 100% AI | |
Half-AI Half-Human (~50% Is Better) | Zero-Font Article With AI | 44% AI |
Human-.서면 텍스트 (낮은 %일수록 좋음) | 제로 폰트 기사 | 0% AI |
ZeroGPT
무료 ChatGPT 감지 솔루션을 찾는 분들을 위한 대안입니다, ZeroGPT는 매력적인 대안을 제시합니다. 이 플랫폼의 웹 기반 탐지기는 스캔당 최대 15,000자까지 허용하며 동시에 최대 5개의 파일을 일괄 스캔할 수 있습니다.
추가 서비스를 원하는 사람들을 위해 ZeroGPT는 다양한 기능을 갖춘 비용 효율적인 프리미엄 플랜을 제공합니다. 월 $8.29의 기본 요금제는 각 스캔에 50,000자의 액세스를 제공하며, 월 $9.99의 고급 요금제는 일괄 스캔당 50개의 파일 제한과 함께 스캔당 100,000자로 이 제한을 향상시킵니다. 또한 이러한 상위 요금제에는 기본 웹 사이트에서 광고를 비활성화할 수 있는 추가 혜택도 제공됩니다.
결과 측면에서 ZeroGPT의 성능은 매우 뛰어났으며, 모든 AI 기반 문서가 높은 점수를 받았고 사람이 작성한 콘텐츠는 상대적으로 낮은 점수를 받았습니다. 흥미롭게도 AI와 사람의 기여가 결합된 작업은 전적으로 사람이 작성한 것처럼 보이는 놀라운 결과를 낳았습니다.
텍스트 출처 | 시험에 사용된 지문 | AI 신뢰도 등급 |
---|---|---|
AI 생성 텍스트 (높은 %일수록 좋음) | ChatGPT 3.5 Essay | 95.31% AI |
ChatGPT 4 Essay | 97.58% AI | |
ChatGPT 3.5 자기소개서 | 99.36% AI | |
ChatGPT 4 자기소개서 | 94.49% AI | |
반AI 반인간 (~50%는 더 좋음) | AI가 있는 제로 폰트 기사 | 0% AI |
사람이 쓴 텍스트 (낮은 %는 더 좋음) | 제로 폰트 기사 | 10.99% AI |
전문가를 위한 최고의 ChatGPT 스캐닝 도구
개인을 식별하는 데 ChatGPT를 활용하는 데는 몇 가지 어려움이 있을 수 있지만 이러한 노력을 지원하기 위한 다양한 리소스가 존재합니다. 인공지능을 사용한 개인을 기소할 때 이러한 도구는 광범위한 조사에서 하나의 요소로만 사용되어야 한다는 점을 인식하는 것이 중요합니다. 단일 조사 결과만을 근거로 단정적으로 비난하는 것은 신중하지 못합니다.