사용자가 쉽게 대화할 수 있는 기능을 제공하는 고급 AI 도구인 ChatGPT는 세계 최고의 챗봇으로 널리 인정받고 있습니다. 자극적인 토론에 참여하고, 질문에 대한 답을 찾고, 상상력이 풍부한 아이디어를 얻고, 코딩 및 작문 작업을 용이하게 하려는 개인이 널리 활용하고 있습니다. 하지만 ChatGPT는 사용자 데이터를 장기간 저장할 수 없고, 지식 데이터베이스가 2021년 9월에 마지막으로 업데이트되었기 때문에 특정 제약이 있습니다.
대안적인 해결책은 2021년까지 제공되는 것 이상의 맞춤형 정보 및 업데이트를 ChatGPT에 제공하기 위해 OpenAI의 API와 LangChain을 활용하여 개인화된 ChatGPT 인스턴스를 생성하는 것입니다.
ChatGPT에 맞춤 데이터를 제공하는 이유는 무엇인가요?
사용자 지정 데이터를 활용하여 ChatGPT의 지식 마감일 이후 정보를 업데이트하는 것은 단순히 기존 방식으로 데이터를 활용하는 것과 비교하여 많은 이점이 있습니다. 이러한 장점 중 일부는 다음과 같습니다:
사용자 지정 데이터 제공을 통한 개인화를 통해 사용자는 자신에게 더욱 맞춤화된 경험을 만들 수 있습니다. 이는 ChatGPT라고 하는 모델을 개별 사용자 또는 그룹과 관련된 특정 데이터베이스를 활용하여 미세 조정할 수 있기 때문에 가능하며, 이를 통해 각 사용자의 고유한 요구 사항과 성향에 맞는 응답을 제공할 수 있습니다.
ChatGPT의 맞춤형 데이터 통합 기능을 통해 특정 도메인 또는 산업 분야에서 탁월한 전문성을 개발할 수 있습니다. 이는 산업별 정보, 어휘 및 트렌드에 대한 교육을 제공함으로써 달성되며, 특정 전문 분야 내에서 보다 정확하고 심도 있는 대응을 가능하게 합니다.
최신 데이터를 확보하는 것은 AI 언어 모델로서 ChatGPT의 관련성을 유지하는 데 매우 중요합니다. 데이터베이스를 지속적으로 업데이트함으로써 ChatGPT는 최신 사실, 뉴스 또는 연구에 기반한 정확한 답변을 제공하여 정보 제공자로서의 신뢰성을 높일 수 있습니다.
개인 컴퓨팅 장치에서 단계별 절차를 통해 ChatGPT에 맞춤형 정보를 제공하기 위한 전체 가이드가 아래에 설명되어 있습니다.
1단계: 소프트웨어 및 사전 제작된 스크립트 설치 및 다운로드
다음 지침은 Windows 10 또는 Windows 11이 설치된 컴퓨터 시스템 작동에 관한 것입니다.
로컬 환경을 사용하여 ChatGPT에 개인화 정보를 제공하기 위해서는 최신 버전의 Python 3, Git, Microsoft Visual C++ 및 ChatGPT 검색 스크립트를 GitHub를 통해 설정하고 구해야 합니다. 원활한 워크플로우를 위해 필요한 모든 소프트웨어는 컴퓨터에서 최신 버전으로 업데이트하는 것이 좋습니다.
⭐ 다운로드: Python3 (무료)
⭐ 다운로드: Git (무료)
⭐ 다운로드: Microsoft 비주얼 빌드 도구 (무료)
Python3 및 Microsoft C++ 설치 참고 사항
Python3를 설정하는 과정에서 “지금 설치”를 클릭하기 전에 시스템의 PATH 환경 변수에 python.exe 파일 경로를 추가하는 옵션이 선택되었는지 확인하세요. 이 단계는 사용자가 컴퓨터 디렉터리 내 어느 위치에서나 파이썬을 사용할 수 있도록 하기 때문에 매우 중요합니다.
Microsoft C++를 설치하는 과정은 두 단계로 이루어집니다. 먼저 마이크로소프트 비주얼 스튜디오 빌드 도구를 설정해야 합니다. 그런 다음 설치 과정에서 C++를 사용한 데스크톱 개발을 선택하고 사이드바에서 옆에 있는 확인란을 수동으로 선택하여 필요한 구성 요소를 선택해야 합니다.
Python3, Git 및 Microsoft C++의 최신 버전을 설치하면 간단한 Python 스크립트를 통해 맞춤형 지역 정보를 수집할 수 있습니다.
다운로드: ChatGPT 검색 스크립트 (무료)
‘다운로드’ 메뉴에서 적절한 옵션을 선택하여 원하는 위치에 파일을 저장하세요. 다운로드한 콘텐츠는 파이썬 스크립트가 포함된 압축된 아카이브 형태입니다. 콘텐츠를 추출하려면 다운로드한 파일을 마우스 오른쪽 버튼으로 클릭하고 “모두 추출”을 선택하거나 WinRAR과 같은 압축 도구를 사용하여 아카이브의 콘텐츠에 액세스하세요.
2단계: 로컬 환경 설정
시스템에서 chatgpt-retrieval-main 디렉토리로 이동하여 터미널 아이콘을 클릭하거나 애플리케이션 메뉴를 통해 그 안에 있는 터미널을 엽니다. 터미널이 열리면 ‘cd chatgpt-retrieval-main’ 명령을 입력하여 현재 작업 디렉터리를 원하는 위치로 변경합니다.
기존 파일에 액세스하거나 nano 텍스트 편집기를 사용하여 새 파일을 생성하여 라즈베리 파이 프로젝트의 코드를 편집할 것을 제안합니다. 그런 다음 터미널에 적절한 경로를 입력하고 경로 뒤에 “cd” 명령을 실행하여 파일이 저장된 디렉토리로 이동해야 합니다. 그런 다음 터미널에 “make”를 입력하여 메이크파일을 실행해야 합니다.
pip install langchain openai chromadb tiktoken unstructured
앞서 언급한 프로세스는 파이썬 패키징 관리자를 사용하여 파이썬에 필요한 가상 환경을 생성하고 감독합니다.
가상 환경을 생성한 후에는 해당 서비스에 액세스하기 위해 OpenAI API 키를 제공해야 합니다. 먼저 OpenAI API 키 사이트 에서 새 비밀 키 만들기를 클릭하고 키 이름을 추가한 다음 비밀 키 만들기 버튼을 눌러 API 키를 생성해야 합니다.
가상 환경이 성공적으로 설정되고 환경 변수로 OpenAI API 키가 추가되면 ChatGPT에 사용자 지정 데이터를 제공할 수 있습니다.
3단계: 사용자 지정 데이터 추가
통합하려는 사용자 지정 데이터가 ChatGPT 검색 메인 디렉터리 내에 있는 지정된 “데이터” 폴더에 있는지 확인하세요. 해당 데이터는 PDF, TXT 또는 DOC와 같은 호환 가능한 형식이어야 합니다.
위의 스크린샷은 파이썬 스크립트에서 사용할 개인 일정 문서, AMD의 Instinct 가속기에 대한 워드 문서 및 PDF 파일을 표시하며, 모두 데모 목적으로 시스템에 삽입되었습니다.
4단계: 터미널을 통해 ChatGPT 쿼리
Python 스크립트를 사용하면 “데이터” 폴더에 추가된 사용자 지정 데이터와 인터넷 모두에서 정보를 검색할 수 있는 권한이 부여됩니다. 따라서 사용자는 “데이터” 폴더에 로컬로 저장된 데이터와 함께 ChatGPT 백엔드의 표준 기능에 액세스할 수 있습니다.
스크립트를 사용하려면 python chatgpt.py 스크립트를 실행한 다음 질문 또는 쿼리를 인수로 추가합니다.
python chatgpt.py "YOUR QUESTION"
ChatGPT에 필요한 데이터를 효과적으로 제공했는지 여부를 확인하기 위해 개인 Sched.txt 파일과 관련된 세부 정보를 문의해도 될까요?
개인 스케줄.txt 파일이 ChatGPT에 의해 성공적으로 처리되었으며, 이는 프로그램이 제시된 내용을 이해할 수 있었음을 나타냅니다. 다음 단계는 ChatGPT가 기존 지식 기반 외에 새로운 정보를 효과적으로 통합했는지 여부를 확인하는 것입니다.
앞서 설명한 내용은 ChatGPT-3의 지식 업데이트 기간이 종료된 이후에 도입된 AMD Instinct MI250x에 관한 것입니다.
커스텀 ChatGPT의 한계
GPT-3.5에 필요한 자료를 제공하는 커스텀 데이터의 활용은 LLM의 적용 및 사용 범위를 넓혀주는 반면, 특정 단점과 제한 사항도 포함하고 있습니다.
GPT-3.5의 기능을 활용하려면 모든 관련 정보를 제공해야 합니다. 지정된 지식 한계점까지 GPT-3.5의 축적된 지혜를 계속 활용할 수 있지만, 그럼에도 불구하고 현지 설치에 필요한 모든 추가 데이터를 제공해야 합니다. 따라서 개인이 GPT-3.5의 범위를 넘어 특정 주제와 관련된 전문 지식을 지역 모델에 포함시키려는 경우 웹 스크래핑을 통해 해당 정보를 확보하여 chatgpt-retrieval-main의 데이터 디렉토리에 있는 적절한 텍스트 파일에 저장해야 합니다.
반복되는 프롬프트를 통해 ChatGPT를 조회하는 프로세스는 ChatGPT에 바로 문의하는 것과 달리 로딩에 더 긴 시간이 필요합니다.
현재 시나리오의 특이점은 접근 가능한 유일한 모델이 GPT-3.5 Turbo라는 사실에 있습니다. 따라서 GPT-4를 활용할 수 있는 권한이 있더라도 개인화된 ChatGPT 플랫폼을 만드는 데 그 잠재력을 활용할 수 없습니다.
맞춤형 ChatGPT는 훌륭하지만 제한적입니다
ChatGPT에 제공된 맞춤형 데이터를 활용하면 모델의 성능이 향상될 수 있습니다. 이 접근 방식을 사용하면 원하는 텍스트 데이터를 제출한 다음 일반 ChatGPT 사용과 유사한 지침을 제공할 수 있지만 특정 제한이 적용될 수 있습니다. 하지만 이러한 제약은 가까운 시일 내에 데이터를 LLM과 통합하고 최신 GPT-4 버전에 대한 액세스를 얻는 과정이 더욱 간소화됨에 따라 완화될 것으로 보입니다.