將數據從網站導入 Google 表格的 4 種方法
數據在決策和分析中發揮著至關重要的作用。無論您是業務分析師、研究人員還是任何需要處理大數據的人,將在線數據有效導入電子表格的能力都是非常寶貴的。
當嘗試合併從網絡來源獲得的信息時,使用 Google Sheets 作為數據分析工具提出了固有的挑戰。儘管付出了努力,但通常會導致電子表格中基本格式的丟失。
值得慶幸的是,還有一種替代方法。有多種有效的技術可以提高效率和輕鬆地將數據從網站導入 Google 表格。
將數據從網站導入 Google 表格
Google Sheets 提供了多種從網站導入數據的方法,包括利用內置的 IMPORT 功能或安裝有助於無縫數據獲取的補充插件。
INFORM 函數包含一系列功能,包括 IMPORTDATA、IMPORTHTML 和 IMPORTXML。儘管每種方法都有其獨特的用途,但它們並非旨在處理獲取機密數據所需的身份驗證要求。
如果需要進行身份驗證才能訪問特定服務,則需要使用 Google Sheets 中的插件,該插件允許使用用戶的憑據進行訪問,隨後允許將數據導入到活動電子表格中。為了進一步澄清,有多種技術可用於將信息導入 Google 表格。
導入數據
IMPORTDATA 函數的使用有助於在 Google 表格中輕鬆集成來自在線源的信息,例如逗號分隔值 (CSV) 和製表符分隔值 (TSV)。這種方法需要的配置可以忽略不計,因此使其成為將數據從互聯網導入電子表格程序的便捷方法。
=IMPORTDATA(URL, delimeter, locale)
“IMPORTDATA”函數無縫檢索指定源文件中的數據並將其合併到電子表格中。該過程的必要組件在其語法中概述,其中包括將文件的 URL 指定為“URL”,使用“delimiter”指定解析分隔符,以及確定“locale”要使用的特定區域設置。
Delimiter和locale是Excel中IMPORTDATA函數的最後兩個參數,如果沒有明確指定,可以省略。默認情況下,該函數根據導入的數據採用這些值。通常,建議忽略它們以獲得更無縫的導入過程。
考慮以下實例,其中特定公式從指定的 CSV 文檔檢索信息:
=IMPORTDATA("https://people.sc.fsu.edu/~jburkardt/data/csv/crash_catalonia.csv")
當未指定時,分隔符和區域設置的默認值由 IMPORTDATA 確定。需要注意的是,此功能僅適用於 CSV 和 TSV 文件,而不適用於網站。嘗試使用 IMPORTDATA 從網站導入數據可能會產生意外結果或錯誤。
導入HTML
IMPORTHTML 函數提供了一種有利的解決方案,用於從網站上的表格或基於列表的內容中提取信息,而不是依賴通用性較差的 IMPORTDATA 方法,後者需要訪問專用的 CSV 文件。
=IMPORTHTML(URL, query_type, index)
在網頁地址的語法中,表示為“URL”,參數“query\_type”有兩個可能的值。這些值表示將從網頁返回的數據類型。第一個值“table”表示信息以表格形式呈現,而第二個值“list”表示信息以枚舉系列的形式出現。此外,當請求表格格式的數據時,還存在另一個稱為“index”的變量,它指定網站內要顯示其內容的特定表格。
事實上,人們可以利用函數 IMPORTHTML 來合併維基百科條目中的表格,如下所示:
=IMPORTHTML("https://en.wikipedia.org/wiki/Demographics_of_Germany", "table", 8)
利用給定公式中的 IMPORTHTML 函數,我們通過提取該頁面上第八個表的內容來檢索特定網址的信息。
導入XML
IMPORTXML 函數可以利用此處概述的指定語法從 XML 和 HTML 文檔中提取信息:
=IMPORTXML(URL, xpath_query)
在此語法中,URL 是網頁的地址,xpath_query 是標識要導入的節點的 XPath 查詢。在 Google 表格中使用 IMPORTXML 的先決條件是對 XML 是什麼以及如何使用 XPath 查詢 導航 XML 文件有基本的了解。
考慮一個場景,其中提供的代碼生成一個 XML 文檔,其中包含植物信息,包括各自的標籤和簡要說明,如下圖所示:
=IMPORTXML("https://www.w3schools.com/xml/plant_catalog.xml", "CATALOG/PLANT")
本公式利用 IMPORTXML 通過首先檢索用作 CATALOG 元素的子實體的 PLANT 元素來從 XML 文檔中提取信息。由於未提供特定區域設置,因此該函數採用 XML 源材料中固有的默認語言設置。
為了確保網址格式正確,建議將其輸入到不同的單元格中,並在公式中引用該單元格。
利用基本的 HTML 標籤和 XPath 查詢使人們能夠充分利用 IMPORTXML 函數的潛力。作為說明,提供的方程檢索文章中的所有 H2 標題:
=IMPORTXML(B2, "//*/h2")
使用 Google Sheets 插件導入數據
Google Sheets 通過其內置功能提供了一系列功能。然而,它還允許與稱為第三方插件的外部應用程序集成,這增強了其從各種互聯網資源中提取信息的能力。此過程簡化了數據的輸入並提高了電子表格的性能。
這些擴展在提供對受保護信息的訪問方面提供了顯著的好處。值得注意的是,在處理特定數據源和格式時,每個擴展都有自己的優勢。因此,選擇最合適的 Google Sheets 插件來導入您的特定數據集將取決於您希望使用的數據的性質和來源。
合併這些附加工具可以在 Google Sheets 中實現信息的無縫集成和傳輸,並提供一系列可供用戶考慮的高效選項。
⭐ Coefficient:Coefficient 是一款用戶友好的 Google 表格插件,旨在幫助您從網站獲取數據而無需編碼。通過其界面,您可以選擇要導入的特定數據元素並享受實時更新。 Coefficient 支持 Salesforce、Hubspot、Google Analytics、Redshift、Looker、Tableau、MySQL 等業務系統。
⭐ Coupler.io:Coupler.io 是另一個出色的插件,可以簡化將數據導入 Google 表格的過程。除了從各種來源導入數據之外,Coupler.io 還允許您安排自動導入以使電子表格保持最新狀態。 Coupler.io 與 Google Analytics、Mailchimp、HubSpot、Salesforce、Shopify、Xero、Airtable、Trello 等無縫協作。
⭐ Awesome Table:除了導入數據之外,Awesome Table 還允許您自定義和轉換數據以增強數據分析。 Awesome Table 允許您使用直觀的數據過濾器選擇要導入的數據並安排自動刷新。它適用於 QuickBooks、Xero、HubSpot、Airtable、Notion、YouTube 等。
通過使用這些 Google Sheets 插件,無需複雜的公式或了解 XML 編碼,從而簡化了導入數據的過程。此外,包括數據操作和自動調度在內的附加功能進一步提高了工作流程中的運營效率。
簡化 Google 表格中的數據導入
將從互聯網來源獲得的大型數據集合併到電子表格中可能會讓人感到不舒服。但是,Google Sheets 提供了本機功能以及各種第三方擴展,可以有效地簡化此過程。
熟練地將在線數據導入 Google Sheets 可以賦予人們一套不可或缺的能力,有助於快速獲取相關信息。通過使用此類技術,不僅可以簡化集成過程,還可以專注於對累積數據的分析。