시장 조사, 애널리스트로서의 포트폴리오 개발, 시장 범위 확대 등 다양한 분야에서 정보에 입각한 의사 결정을 내리기 위해서는 정보에 입각한 선택을 뒷받침할 수 있는 정확하고 신뢰할 수 있는 정보에 접근하는 것이 중요합니다.
인터넷에서 데이터를 얻는 것은 귀중한 리소스가 될 수 있지만 어려움이 없는 것은 아닙니다. 다행히도 이 글에서는 검색에 도움이 되는 신뢰할 수 있고 쉽게 액세스할 수 있는 무료 데이터를 제공하는 몇 가지 주요 웹사이트에 대한 개요를 제공합니다.
Google 트렌드
Google 트렌드는 Google에서 제공하는 서비스로, 사용자에게 플랫폼에서 수행된 검색과 관련된 원시 데이터에 대한 액세스를 제공합니다. 이 서비스는 2004년부터 현재까지의 시계열 데이터 형태로 순수한 정보를 제공하며, 전 세계 및 지역 수준, 도시 지역 모두에 대해 사용할 수 있습니다. 그러나 이러한 검색을 수행한 개인에 대한 구체적인 정보는 공개하지 않습니다.
Google 트렌드를 사용하여 카테고리, 언어, 엔티티 또는 Google의 인기 검색어에 초점을 맞추도록 데이터를 제한할 수도 있습니다. 사용 가능한 데이터의 예로는 지난 7일 동안의 데이터를 보여주는 일일 검색 트렌드 및 실시간 검색 트렌드 이 있습니다.
FiveThirtyEight
FiveThirtyEight는 정치 여론조사 분석, 스포츠 이벤트, 대중문화 트렌드, 과학 연구 결과, 경제 뉴스 동향 등 다양한 영역의 데이터 기반 저널리즘을 전문으로 하는 온라인 간행물입니다.
이 웹사이트의 가장 큰 장점은 웹사이트 또는 공식 GitHub 리포지토리 에서 데이터를 다운로드하고 데이터 시각화 도구를 사용하여 청중을 위한 매력적인 데이터 저널리즘 비주얼을 만들 수 있다는 것입니다. 월드컵 예측 및 2022-23 NHL 예측 데이터 등이 흥미로운 데이터의 몇 가지 예입니다.
버즈피드 뉴스
버즈피드 뉴스는 저널리즘, 기술, 엔터테인먼트, 유명인, 문화, DIY 프로젝트, 건강, 정치 등 다양한 주제를 다루는 최신 뉴스 기사를 제공하는 다방면의 미국 미디어 매체입니다.
버즈피드 뉴스는 GitHub에서 버즈피드 뉴스룸의 데이터 세트, 도구 및 분석을 오픈소스로 공개하여 누구나 액세스하고 사용할 수 있도록 합니다. 예를 들어 FBI NICS 총기 신원 조회 데이터 .
Data.gov
미국 정부는 다양한 국내외 정부 기관에서 제공하는 25만 개 이상의 공개적으로 액세스 가능하고 철저하게 문서화된 데이터 집합을 호스팅하는 종합 플랫폼인 Data.gov를 구축했습니다. 이 이니셔티브는 시민들이 정부 운영과 관련된 정보에 쉽게 접근할 수 있도록 하여 투명성을 증진하고자 합니다.
웹 사이트에서 주제와 기관 또는 조직에 따라 데이터에 액세스할 수 있습니다. 국가 학자금 대출 데이터 시스템 및 전기 자동차 인구 데이터 등이 Data.gov에서 찾을 수 있는 데이터의 예입니다.
캐글
캐글은 데이터 애호가 및 전문가를 위한 온라인 커뮤니티 중심 플랫폼으로, 2017년에 Google에 인수되었습니다. 여러 도메인에 걸쳐 다양한 데이터 집합에 대한 액세스를 제공하여 사용자가 탐색, 분석 및 결과를 공유할 수 있도록 지원합니다. 이 사이트는 코드 공유, 토론 포럼 및 학습 리소스를 통해 협업을 촉진하여 회원 간의 지식 교환을 촉진합니다. 또한, Kaggle은 참가자들이 특정 데이터 세트 또는 문제를 기반으로 솔루션을 제출하도록 장려하는 “kaggle 커널”이라는 경쟁 이벤트를 개최하여 최고 성적을 거둔 참가자에게 매력적인 상금을 수여합니다.
이 가이드는 데이터 과학을 위해 Kaggle을 시작하는 방법에 대한 초보자 가이드를 제공합니다. 글로벌 YouTube 통계 2023 .
NASA의 지구 데이터
NASA는 1994년부터 현재까지 지구 관련 데이터의 종합적인 리포지토리 역할을 하는 EarthData라는 이니셔티브를 시작했습니다. 이 데이터베이스에는 지구의 대기, 해양 및 육상 수권 특성과 관련된 원격 감지 위성에서 파생된 데이터를 포함한 다양한 데이터 세트가 포함되어 있습니다.
다양한 주제를 탐색하고 극심한 열 데이터 와 같은 데이터에 액세스할 수 있습니다. 그러나 지구 외 데이터는 NASA의 행성 데이터 시스템 을 탐색해야 합니다.
IMDb 데이터 세트
IMDb는 영화, TV 시리즈, 홈 비디오, 팟캐스트, 비디오 게임, 스트리밍 정보 및 유명인 콘텐츠에 대한 데이터를 제공합니다. 예를 들어 IMDb 비상업적 데이터 세트 .
AWS 퍼블릭 데이터셋
AWS 퍼블릭 데이터셋은 AWS 서비스를 통해 공개적으로 제공되는 3000개 이상의 데이터셋을 호스팅하는 웹사이트입니다. 여기에 있는 대부분의 데이터 세트는 프로젝트 기반입니다. 여기에는 암 게놈 아틀라스 및 폴딩어톰 COVID-19 데이터 세트 이 포함됩니다.
인사이드 에어비앤비
인사이드 에어비앤비는 머레이 콕스가 시작한 감시 웹사이트입니다. 이 웹사이트는 전 세계 사용자에게 저렴한 가격의 객실을 제공하는 플랫폼인 에어비앤비에서 공개적으로 제공되는 데이터를 기반으로 합니다. 이 사이트의 정보를 사용하여 몬트리올 의 임대 분석과 같은 분석을 수행할 수 있습니다.
Google 데이터세트 검색
Google 데이터세트 검색은 Google에서 만든 데이터세트 검색 엔진으로, 2천만 개 이상의 데이터세트를 호스팅하고 있습니다. 검색 엔진과 마찬가지로 거의 모든 데이터에서 데이터를 얻을 수 있습니다. 좋은 예로 캐나다 국가 장기 수질 모니터링 데이터 .
UCI 머신 러닝 리포지토리
UC Irvine 머신 러닝 리포지토리는 전 세계 머신 러닝 커뮤니티를 위한 624개의 데이터 세트가 있는 곳입니다. 이 웹사이트는 데이터 집합이 적합한 머신 러닝 작업에 따라 분류되어 있기 때문에 커뮤니티에서 높은 평판을 얻고 있습니다. 예를 들어 홍채 데이터 세트 는 유명한 분류 및 클러스터링 모델 데이터 세트입니다.
Datahub.io
플랫폼으로서의 데이터 허브에는 10년 만기 미국 국채 수익률(장기 금리) 과 같이 광범위한 주제를 다루는 많은 데이터 세트가 있습니다. 데이터 외에도 데이터 전문가를 위한 데이터 도구와 툴킷도 제공합니다.
글로벌 보건 관측소 데이터 저장소
이번에 선정된 첫 번째 온라인 플랫폼은 글로벌 보건 관측소를 통해 종합적인 보건 정보를 제공합니다. 이 리소스는 세계보건기구의 194개 회원국과 관련된 1,000개 이상의 통계 지표로 구성된 광범위한 데이터베이스를 제공합니다. 이러한 데이터는 지속 가능한 개발 목표를 달성하기 위한 각 국가의 진행 상황을 추적하는 데 사용됩니다. 사용자는 특정 테마, 카테고리, 메타데이터 또는 지표를 선택하여 검색 매개변수를 세분화할 수 있습니다.
영국 영화 연구소
이 플랫폼은 정말 틈새 기반입니다. 주말 박스오피스 수치 및 영국 영화 산업에 대한 관련 데이터와 같은 연구 데이터 및 시장 정보 정보를 보여줍니다.
깃허브
깃허브는 수백만 개의 협업 및 오픈소스 프로젝트의 홈 그 이상입니다. 이 플랫폼은 또한 무료, 공개, 오픈 소스 데이터 세트를 보관하는 것을 목표로 하는 많은 리포지토리를 호스팅합니다. 심지어 BuzzFeedNews에도 오픈 소스 GitHub 리포지토리 .
다른 예로는 멋진 공개 데이터 세트 리포지토리 및 데이터 세트 를 들 수 있습니다. 이러한 오픈소스 프로젝트는 GitHub에서도 기여할 수 있습니다.
Data.world
Data.world는 데이터 프로젝트와 데이터 집합을 호스팅하는 데이터 커뮤니티이자 공동 작업 플랫폼입니다. 일부 데이터 세트는 유료이지만, Makeover Monday’s 2021/W16: 미국의 월간 항공 승객 등 플랫폼에 있는 대부분의 데이터는 무료이며, 로컬에서 쉽게 다운로드하거나 API를 통해 액세스할 수 있습니다.
세계은행 오픈 데이터
세계은행 오픈 데이터는 세계 경제 및 개발 데이터의 카탈로그입니다. 건강한 식단의 비용과 경제성에 대한 글로벌 통계 와 같은 데이터를 지표 및 국가별로 검색하고 필터링할 수 있습니다.
나스닥 데이터
나스닥 데이터 링크는 금융, 경제 및 대체 데이터에 대한 모든 것을 제공합니다. Excel과 같은 스프레드시트 또는 API를 통해 미국 연방 준비 은행 데이터 릴리스 과 같은 데이터에 액세스할 수 있습니다.
NYC TLC
뉴욕시 택시 및 리무진 위원회 데이터 플랫폼 기록 및 뉴욕시 전역 노란색 및 녹색 택시 운행 기록 과 같은 정보를 호스팅하고 있습니다. 이 웹사이트의 가장 큰 장점은 픽업/드롭오프부터 택시 구역 및 여행 요금에 이르기까지 모든 정보를 표시한다는 것입니다.
학술 급류
학술 급류는 127.15 테라바이트 이상의 연구 중심 데이터로 구성된 방대한 저장소로, 학자들의 요구와 그들의 노력을 충족시키기 위해 특별히 설계되었습니다.
탐색 및 학습
실제로 이 개요서를 활용하면 상업적 관점에 정보를 제공하고, 시장 조사를 용이하게 하며, 경쟁 우위를 확보하고, 비용 부담 없이 탁월한 데이터 저장소를 구축할 수 있는 정보를 획득할 수 있습니다. 따라서 이러한 가능성을 포착하고 더 깊이 파고들어 데이터에 대한 보다 관리하기 쉬운 추구를 경험하는 것이 좋습니다.