All Things N 계정에 로그인하세요

저는 제가 꽤 정돈된 사람이라고 생각합니다. 폴더 안에 폴더를 만들고, 설명적인 파일 이름을 사용하며, 때로는 스스로가 매우 절제하고 있다고 느껴질 때는 날짜 접두사까지 붙이기도 합니다. 대부분의 경우, 이 시스템은 잘 작동합니다. 적어도 약 18개월 전에 썼던 무언가를 찾아야 하기 전까지는 말이죠. 중간 어딘가에 묻혀 있던 희미한 반 문장으로만 기억저는 문서였습니다. Windows 검색을 대체하지 않으면서 성능을 개선하는 몇 가지 간단한 설정을 적용했음에도 불구하고, 쓸만한 결과는 얻지 못했습니다. Mac의 Spotlight도 똑같이 무관심하게 반응했을 것이라 생각합니다. 저는 20분(어쩌면 그 이상이었을지도 모릅니다) 동안 파일을 하나씩 열어보다가 결국 완전히 포기했습니다. 파일은 분명 제 컴퓨터 어딘가에 있었지만, 기능적으로는 허공으로 사라진 것과 다름없었습니다.

자주 반복되던 그 경험이 저를 깊은 고민의 늪으로 이끌었고, 그 끝에서 발견한 것이 바로 DocFetcher였습니다. 이 프로그램은 무료이며 오픈 소스이고, 파일 이름뿐만 아니라 파일 내부까지 검색합니다.

관련 기사

"일반적인" 검색의 문제점

파일은 그곳에 있지만, Windows Search는 관심이 없습니다

운영체제에 내장된 검색 기능은 대부분 몇 가지 기능이 추가된 파일 이름 스캐너에 불과합니다. 파일이 존재하는지, 어디에 있는지는 알지만, 그 안에 무엇이 들어있는지는 전혀 제대로 알려주지 못합니다. 기술적으로는 인덱스 설정을 조정하여 Windows에서 파일 내용을 기본적으로 검색할 수 있게 만들 수는 있지만, 일반적으로 속도가 느리고 리소스를 많이 소모합니다. DocFetcher는 파일 이름만 보는 대신 PDF, 문서, 스프레드시트, 메모, 코드, 아카이브, 심지어 eBook까지 파일 내부를 들여다봅니다. 그 단 하나의 차이가 문제의 본질을 완전히 바꿔놓습니다.

일반적인 상황을 생각해 보세요. 문서가 필요하지만 파일 이름이 무엇인지, 어디에 저장했는지, 몇 년도에 만들었는지조차 기억나지 않습니다. 단지 문구 하나(고객 이름, 프로젝트 제목, 특정 문장 등)만 기억날 뿐입니다. 표준 검색 기능으로는 아무것도 찾을 수 없습니다. DocFetcher로 폴더를 인덱싱하면 문서의 파편이나 문구, 기억저는 키워드를 입력하기만 해도 DocFetcher가 문제없이 찾아줍니다.

이 글도 확인해 보세요:  생산성을 높여주는 최고의 포모도로 타이머 앱

인덱싱은 실제로 어떻게 작동할까요? (그리고 왜 빠를까요?)

모든 것을 한 번 읽어두면, 다시는 헤맬 필요가 없습니다

DocFetcher는 인덱싱 기반 검색 도구입니다. 즉, 검색할 때마다 모든 파일을 처음부터 스캔하지 않습니다. 컴퓨터의 모든 파일을 스캔하는 대신, 파일 내용을 담은 로컬 데이터베이스를 확인합니다. 덕분에 검색 결과가 즉시 나타납니다. 내부 검색 엔진은 Apache Lucene을 기반으로 구축되었으며, 이는 훨씬 비싼 도구들에서도 검색 기능을 구동하는 널리 사용되는 오픈 소스 엔진입니다.

단점은 처음에 약간의 작업이 필요하다는 것입니다. DocFetcher를 처음 열면 검색하려는 폴더를 지정하고 인덱싱을 수행해야 합니다. 컬렉션 크기에 따라 시간이 좀 걸릴 수 있습니다(대략 분당 200개 파일 정도가 기준입니다). 하지만 일단 완료되면 다시는 기다릴 필요가 거의 없습니다. 파일이 변경되면 DocFetcher가 백그라운드에서 자동으로 인덱스를 업데이트하므로 결과는 항상 최신 상태로 유지됩니다. 인덱싱 과정은 백그라운드에서 진행되며 자동으로 실행되도록 설정할 수 있습니다.

DocFetcher는 기본적으로 아무것도 인덱싱하지 않으며, 인덱싱할 데이터 선택을 사용자에게 맡깁니다. 이는 불필요한 데이터를 줄이고, 대부분의 사람이 하드 드라이브 전체를 검색할 필요는 없다는 점을 고려한 의도적인 선택입니다. 무엇을 포함할지 사용자가 결정하므로, 결과물도 훨씬 깔끔합니다.

무엇을 검색할 수 있을까요? (생각보다 목록이 깁니다)

파일에 텍스트가 포함되어 있다면, DocFetcher는 이미 관심을 가집니다

DocFetcher는 PDF, Word 문서, Excel 스프레드시트, HTML 파일 등 총 50가지가 넘는 광범위한 파일 형식을 지원합니다. 최신 Office 형식(docx, xlsx, pptx)은 물론 이전 형식, OpenOffice 및 LibreOffice 파일, RTF, 일반 텍스트, EPUB, 심지어 MP3 및 JPEG 메타데이터까지 처리합니다. 제가 처음 테스트한 것 중 하나는 Windows Search가 무시하거나 존재하지 않는 척하는 PDF 파일 속에 숨겨진 단어를 DocFetcher가 실제로 찾을 수 있는지였습니다. 결과는 즉시 찾아냈습니다.

제가 생각했던 것보다 훨씬 유용했던 기능은 아카이브 지원입니다. ZIP, RAR, 7z 파일과 같은 압축 아카이브 내부를 검색할 수 있어, 검색 전에 수동으로 압축을 풀 필요가 없습니다. 또한 중첩된 아카이브(zip 안에 7z이 있고, 그 안에 rar이 있는 식)도 지원합니다. 처음에는 특수한 경우라고 생각했지만, 얼마나 많은 다운로드 파일이 압축 폴더에 그대로 방치되어 있는지 깨닫고 나면 이 기능이 얼마나 유용한지 알게 됩니다.

이 글도 확인해 보세요:  Excel의 선택 함수를 사용하여 기준에 따라 데이터를 선택하는 방법

개발자이거나 소스 코드를 다루는 분들을 위한 좋은 기능도 있습니다. DocFetcher가 어떤 파일 확장자를 일반 텍스트로 취급할지 사용자 지정할 수 있어, 어떤 언어나 프레임워크를 사용하든 DocFetcher를 코드 검색 도구로 활용할 수 있습니다.

실제로 사용해 보면 속도가 가장 먼저 눈에 띕니다. 파일 인덱싱이 완료되면(앞서 말했듯 시간이 꽤 걸릴 수 있습니다), 검색은 매우 빠르며 결과가 밀리초 단위로 나타납니다. DocFetcher는 문서 내 검색어를 강조 표시하는 미리보기 패널을 제공하므로, 확인을 위해 각 파일을 일일이 열 필요가 없습니다. 대신 파일을 클릭하면 측면에서 미리보기를 볼 수 있어 즉각적인 문맥 파악이 가능합니다.

검색 구문도 인터페이스가 처음 보여주는 것보다 훨씬 강력합니다. 기본적인 키워드 외에도 와일드카드, 구문 검색, 근사치 검색을 위한 퍼지 매칭, 특정 범위 내에서 단어가 서로 가깝게 나타저는 것을 찾는 근접 검색을 지원합니다. 대부분의 사람은 매일 사용하지 않겠지만, 대략적인 검색이 아닌 정밀한 검색이 필요할 때 매우 유용합니다.

몇 가지 아쉬운 점

장미에는 가시가 있는 법

어떤 도구든 단점을 알기 전까지는 온전히 신뢰할 수 없습니다. DocFetcher는 이미지를 검색하지 않으므로, 스캔한 영수증을 찾으려 한다면 운이 없는 것입니다. 물론 비디오 파일 내의 오디오나 비디오 콘텐츠도 인덱싱하지 않습니다. 하지만 MP3나 FLAC 같은 오디오 파일의 메타데이터(태그, 아티스트, 제목)와 JPG 및 JPEG 이미지의 EXIF 메타데이터는 인덱싱할 수 있습니다. 또한 실시간 인덱싱 기능이 부족하여, 백그라운드에서 지속적으로 업데이트되는 대신 사용자가 지시하거나 프로그램이 실행 중일 때 파일 변경 사항을 감지하여 인덱스를 업데이트합니다.

인터페이스는 예쁘지 않습니다. DocFetcher는 2009년에 디자인된 것처럼 보이며, 실제로도 그렇습니다. 처음 열었을 때 잠시 잘못 선택했나 하는 생각이 들 수도 있습니다. 하지만 다행히도 저는 그 점을 충분히 감수할 수 있었습니다.

그래서, DocFetcher를 실제로 사용해야 할까요?

연구, 글쓰기, 법률, 의료, 개발, 아카이브 등 문서 작업을 많이 하신다면 DocFetcher는 충분히 가치가 있습니다. Windows 11을 위한 최고의 데스크톱 검색 도구들과 비교해도, 이 특정 사용 사례에서는 독보적인 성능을 보여줍니다. 인터페이스가 상을 받을 정도는 아니고, 초기 인덱싱에 인내심이 필요하며, 올바른 파일 정리 습관을 대체할 수는 없습니다. 하지만 이 도구는 여러분이 가진 파일을 데스크톱의 그 어떤 도구보다 훨씬 찾기 쉽게 만들어 줄 것입니다.

이 글도 확인해 보세요:  디지털 작업 시 옆길로 빠지지 않는 6가지 팁

##### DocFetcher

OS Windows, macOS, Linux

개발자 Christian Schmieder

가격 모델 무료 / 오픈 소스

DocFetcher는 컴퓨터의 문서를 인덱싱하여 PDF, Word 파일, 스프레드시트 등의 내부를 즉시 검색할 수 있게 해주는 데스크톱 검색 도구입니다. 파일들을 위한 개인용 오프라인 검색 엔진처럼 작동하여, 깊숙이 묻혀 있는 정보를 훨씬 쉽게 찾을 수 있도록 도와줍니다.

By 박준영

업계에서 7년간 경력을 쌓은 숙련된 iOS 개발자인 박준영님은 원활하고 매끄러운 사용자 경험을 만드는 데 전념하고 있습니다. 애플(Apple) 생태계에 능숙한 준영님은 획기적인 솔루션을 통해 지속적으로 기술 혁신의 한계를 뛰어넘고 있습니다. 소프트웨어 엔지니어링에 대한 탄탄한 지식과 세심한 접근 방식은 독자에게 실용적이면서도 세련된 콘텐츠를 제공하는 데 기여합니다.