數(shù)據(jù)庫、數(shù)據(jù)集市、數(shù)據(jù)倉庫是什么,有什么關系和區(qū)別?
一、數(shù)據(jù)庫、數(shù)據(jù)集市、數(shù)據(jù)倉庫
概念介紹
數(shù)據(jù)倉庫其實就像“農貿市場”,把各種供貨商手上的貨源收集起來,按照一定的規(guī)則擺放整齊供客戶挑選,同時可以通過整個農貿市場的銷售經營情況進行一些細致的分析,對整個市場有更好的了解,從而促銷相應的采購,銷售策略等等。數(shù)據(jù)倉庫是構建面向分析的集成化數(shù)據(jù)環(huán)境,為企業(yè)提供決策支持,它出于分析性報告和決策支持的目的而創(chuàng)建。
那什么是數(shù)據(jù)集市呢?數(shù)據(jù)集市可以比喻成各種專區(qū),賣蔬菜農產品的,賣水產海鮮的,賣肉禽的等等。數(shù)據(jù)集市其實就是一個面向小型的部門或工作組級別的小型數(shù)據(jù)倉庫,只專注于某一個方面的主題分析。
數(shù)據(jù)倉庫本身并不生產數(shù)據(jù),數(shù)據(jù)來源于外部,并且開放給外部應用,這也是為什么叫倉庫,不叫工廠的原因。例如農貿市場并不種植蔬菜、養(yǎng)殖各種水產禽類,而是從各供貨商獲取材料。數(shù)據(jù)集市可以從自己的數(shù)據(jù)源獲取數(shù)據(jù),也可以從數(shù)據(jù)倉庫中獲取某一主題的數(shù)據(jù)。
那從供貨商到農貿市場的中間過程,其實就是所謂的“ETL”過程。ETL就是extract,Transform和load,指的是清洗,轉換和加載。我們都知道,供貨商提供的貨不是什么都要的,我們要篩選出有價值的,暢銷的品種,有些壞的,不新鮮的菜在進農貿市場的過程中就需要去除掉。而不同的供貨商提供的貨可能也存在一些一樣的種類,那么在搬運到農貿市場中就需要做一些歸類合并,按照更好的一種陳列方式擺放整齊供客戶挑選。這個從供貨商搬運,清洗,轉換,加載各種菜的過程就是ETL過程。
在這個過程中,還涉及到ETL的方式和頻率。比如水產海鮮,很多都是速凍空運過來的,一些需求量比較小的比如澳龍可能幾天才送一次,而一些蔬菜是人們日常需要的,大都是周邊蔬菜大棚產的,就會由貨車每天運輸進農貿市場。
這些菜被運送到農貿市場后,會根據(jù)一定的規(guī)則進行擺放讓客戶挑選。我們可以根據(jù)不同的規(guī)則對這些菜進行管理,就像數(shù)據(jù)倉庫的技術框架一樣,我們可以選擇一般的技術框架或者大數(shù)據(jù)技術框架,不同的選擇最終決定了我們數(shù)據(jù)倉庫的使用效果和投入成本。
因此,數(shù)據(jù)倉庫的本質還是一個數(shù)據(jù)庫,它將各個異構的數(shù)據(jù)源,數(shù)據(jù)庫的數(shù)據(jù)統(tǒng)一管理起來,并且完成了相應數(shù)據(jù)的剔除,格式轉換,最終按照一種合理的建模方式來完成源數(shù)據(jù)的組織形式的轉變,以更好的支持前端的可視化分析。
區(qū)別
數(shù)據(jù)倉庫、數(shù)據(jù)湖與關系數(shù)據(jù)庫系統(tǒng)之間的主要區(qū)別在于:
關系數(shù)據(jù)庫用于存儲和整理來自單個來源(例如事務系統(tǒng))的結構化數(shù)據(jù),而數(shù)據(jù)倉庫則用于存儲來自多個來源的結構化數(shù)據(jù)。數(shù)據(jù)湖的不同之處在于它可存儲非結構化、半結構化和結構化數(shù)據(jù)。關系數(shù)據(jù)庫創(chuàng)建起來相對簡單,可用于存儲和整理實時數(shù)據(jù),例如交易數(shù)據(jù)等。關系數(shù)據(jù)庫的缺點是它們不支持非結構化數(shù)據(jù)庫數(shù)據(jù)或現(xiàn)在不斷生成的大量數(shù)據(jù)。這使得我們只能在數(shù)據(jù)倉庫與數(shù)據(jù)湖間做出選擇。盡管如此,很多企業(yè)仍然繼續(xù)依賴關系數(shù)據(jù)庫來完成運營數(shù)據(jù)分析或趨勢分析等任務。
內部或云端可用的關系數(shù)據(jù)庫包括Microsoft SQL Server、Oracle數(shù)據(jù)庫、MySQL和IBM Db2、以及Amazon Relational Database Service、Google Cloud Spanner等。
延伸閱讀:
二、Navicat是什么
Navicat是一套快速、可靠和全面的數(shù)據(jù)庫管理工具,專門用于簡化數(shù)據(jù)庫管理和降低管理成本。Navicat圖形界面直觀,提供簡便的管理方法,設計和操作MySQL、MariaDB、SQL Server、Oracle、PostgreSQL和SQLite的數(shù)據(jù)。
Navicat提供一個直觀和設計完善的用戶界面,用于創(chuàng)建、修改和管理資料庫的所有對象,例如表、視圖、函數(shù)或過程、索引、觸發(fā)器和序列。我們的表設計器幫助用戶創(chuàng)建和修改數(shù)據(jù)庫的表,讓設置高級選項,如關系、限制、觸發(fā)器和更多。
使用Navicat瀏覽和修改數(shù)據(jù),插入、編輯、刪除數(shù)據(jù)或復制和粘貼記錄到數(shù)據(jù)表形式的數(shù)據(jù)編輯器,Navicat將運行相應的命令(例如INSERT或UPDATE),免除寫復雜的SQL。廣泛的數(shù)據(jù)編輯工具令編輯工作更為方便,例如外鍵查找、set/enum選擇器和記錄篩選。

猜你喜歡LIKE
相關推薦HOT
更多>>
format_map與format字符串格式化的區(qū)別是什么?
一、數(shù)據(jù)輸入形式1、format: 主要接受位置或關鍵字參數(shù)。"Hello, {0}".format("world")2、format_map: 接受一個字典作為輸入。"Hello, {name}"....詳情>>
2023-10-16 17:26:04
有效的項目變更管理,能夠減少哪些對項目的影響?
1、時間延遲的減少適時評估:變更請求提出后及時評估其對項目進度的影響有效調整:根據(jù)評估結果調整工作計劃和資源分配控制范圍:通過對變更范...詳情>>
2023-10-16 17:07:04
站在軟件開發(fā)的角度如何做bug分類管理?
一、收集BUG信息在軟件開發(fā)過程中,及時收集BUG信息至關重要。測試團隊應該在發(fā)現(xiàn)BUG后,立即記錄和收集相關信息,包括BUG的描述、復現(xiàn)步驟、嚴...詳情>>
2023-10-16 13:06:03
單片機有什么用?
一、嵌入式系統(tǒng)單片機作為嵌入式系統(tǒng)的核心,廣泛應用于家電、智能設備、工業(yè)控制等領域。在家電中,單片機能夠控制洗衣機、冰箱、微波爐等家用...詳情>>
2023-10-16 12:24:41熱門推薦
管理寫作項目有哪些工具?
沸什么是Gradle Transform?
熱有哪些 GAN 在分類/判別方面的成功應用?
熱format_map與format字符串格式化的區(qū)別是什么?
新有效的項目變更管理,能夠減少哪些對項目的影響?
編程語言為什么要區(qū)分表達式(expression)和語句(statement)?
軟件測試的作用是什么?
windows編程,MFC編程,C語言編程,三者有什么關系?
客戶管理軟件目前的角色權限有哪些?
深度網絡模型調試性能的重要經驗有哪些?
什么是7S管理?
Mysql索引為什么要用B+Tree實現(xiàn)?
MySQL的普通索引和少數(shù)索引有什么區(qū)別?
運維客戶端工具和JumpServer有什么區(qū)別?
技術干貨







快速通道 更多>>
-
課程介紹
點擊獲取大綱 -
就業(yè)前景
查看就業(yè)薪資 -
學習費用
了解課程價格 -
優(yōu)惠活動
領取優(yōu)惠券 -
學習資源
領3000G教程 -
師資團隊
了解師資團隊 -
實戰(zhàn)項目
獲取項目源碼 -
開班地區(qū)
查看來校路線