com.操操|h视频在线观看免费网站|亚洲国产成人在线|国精产品999免费|A片级片免费播放

當(dāng)前位置: fuhua-pet->優(yōu)技培訓(xùn) > StarRocks數(shù)據(jù)庫

StarRocks數(shù)據(jù)庫

2025-05-08作者:firstyuding來源:www.lgjxsb.com
starrocks-logo.jpg

什么是StarRocks?

StarRocks 是一款新一代的、超快的、大規(guī)模并行處理(MPP)數(shù)據(jù)庫,旨在為企業(yè)提供實(shí)時分析的便利。它能夠大規(guī)模地支持亞秒級查詢。

StarRocks 設(shè)計(jì)優(yōu)雅。它包括豐富的功能,包括完全向量化引擎、新設(shè)計(jì)的成本基優(yōu)化器 (CBO) 和智能物化視圖。因此,StarRocks 可以提供遠(yuǎn)超同類數(shù)據(jù)庫產(chǎn)品的查詢速度,尤其是在多表連接方面。

StarRocks非常適合對新鮮數(shù)據(jù)進(jìn)行實(shí)時分析。數(shù)據(jù)可以以高速度攝入,并且可以實(shí)時更新和刪除。StarRocks使用戶能夠創(chuàng)建使用各種模式的表,例如扁平、星型和雪花模式。

兼容 MySQL 協(xié)議和標(biāo)準(zhǔn) SQL,StarRocks 對所有主要的 BI 工具有開箱即用的支持,例如 Tableau 和 Power BI。StarRocks 不依賴任何外部組件。它是一個集成的數(shù)據(jù)分析平臺,允許高可擴(kuò)展性、高可用性和簡化管理與維護(hù)。

StarRocks具有簡單的架構(gòu)。整個系統(tǒng)僅由兩種類型的組件組成;前端節(jié)點(diǎn)和后端節(jié)點(diǎn)。前端節(jié)點(diǎn)被稱為FE。后端節(jié)點(diǎn)有兩種類型,BE和CN(計(jì)算節(jié)點(diǎn))。當(dāng)使用本地?cái)?shù)據(jù)存儲時,部署B(yǎng)Es;當(dāng)數(shù)據(jù)存儲在對象存儲或HDFS上時,部署CNs。StarRocks不依賴于任何外部組件,簡化了部署和維護(hù)。節(jié)點(diǎn)可以水平擴(kuò)展而無需停機(jī)服務(wù)。此外,StarRocks具有元數(shù)據(jù)和服務(wù)數(shù)據(jù)的復(fù)制機(jī)制,這提高了數(shù)據(jù)可靠性并高效地防止了單點(diǎn)故障(SPOFs)。

StarRocks 兼容 MySQL 協(xié)議并支持標(biāo)準(zhǔn) SQL。用戶可以從 MySQL 客戶端輕松連接到 StarRocks,以獲得即時且有價(jià)值的見解。

特色

MPP框架

StarRocks 采用大規(guī)模并行處理 (MPP) 框架。一個查詢請求被分割成多個物理計(jì)算單元,可以在多臺機(jī)器上并行執(zhí)行。每臺機(jī)器都有專用的 CPU 和內(nèi)存資源。MPP 框架充分利用了所有 CPU 內(nèi)核和機(jī)器的資源。隨著集群橫向擴(kuò)展,單個查詢的性能可以持續(xù)提高。

完全矢量化執(zhí)行引擎

全矢量執(zhí)行引擎更高效地利用CPU處理能力,因?yàn)檫@個引擎以列式方式組織和處理數(shù)據(jù)。具體來說,StarRocks以列式方式存儲數(shù)據(jù)、在內(nèi)存中組織數(shù)據(jù)和計(jì)算SQL運(yùn)算符。列式組織充分利用了CPU緩存。列式計(jì)算減少了虛擬函數(shù)調(diào)用和分支判斷的數(shù)量,從而產(chǎn)生了更充分的CPU指令流。

存儲和計(jì)算的分離

從3.0版本開始引入了存儲計(jì)算分離架構(gòu)。在該架構(gòu)中,計(jì)算和存儲被解耦,以實(shí)現(xiàn)資源隔離、計(jì)算節(jié)點(diǎn)的彈性擴(kuò)展以及高性能查詢。存儲計(jì)算分離使StarRocks具備更好的靈活性、更高的性能和數(shù)據(jù)可用性以及更低的成本。

成本基優(yōu)化器

多表連接查詢的性能優(yōu)化非常困難。僅靠執(zhí)行引擎無法提供出色的性能,因?yàn)樵诙啾磉B接查詢的情景中,執(zhí)行計(jì)劃的復(fù)雜性可能會相差幾個數(shù)量級。相關(guān)表越多,執(zhí)行計(jì)劃就越多,這使得選擇最佳計(jì)劃成為NP難題。只有足夠優(yōu)秀的查詢優(yōu)化器才能為高效多表分析選擇一個相對最佳的查詢計(jì)劃。

實(shí)時、可更新的列式存儲引擎

StarRocks 是一種列式存儲引擎,允許相同類型的數(shù)據(jù)連續(xù)存儲。在列式存儲中,數(shù)據(jù)可以以更高效的方式編碼,提高壓縮比并降低存儲成本。列式存儲還減少了總的數(shù)據(jù)讀取 I/O,從而提高查詢性能。此外,在大多數(shù) OLAP 場景中,只查詢特定的列。列式存儲使用戶能夠僅查詢部分列,顯著減少磁盤 I/O。

智能物化視圖

StarRocks 使用智能物化視圖來加速查詢和數(shù)據(jù)倉庫分層。與其他需要手動數(shù)據(jù)同步的物化視圖不同,StarRocks 的物化視圖會根據(jù)基表中的數(shù)據(jù)變化自動更新數(shù)據(jù),無需額外的維護(hù)操作。此外,物化視圖的選擇也是自動的。如果 StarRocks 識別到一個合適的物化視圖(MV)來提高查詢性能,它會自動重寫查詢以利用該 MV。這個智能過程顯著提高了查詢效率,無需手動干預(yù)。

數(shù)據(jù)湖分析

除了對本地?cái)?shù)據(jù)進(jìn)行高效分析之外,StarRocks 還可以作為計(jì)算引擎來分析存儲在數(shù)據(jù)湖中的數(shù)據(jù),例如 Apache Hive、Apache Iceberg、Apache Hudi 和 Delta Lake。StarRocks 的一個關(guān)鍵特性是其外部目錄,它作為與外部維護(hù)的元存儲的鏈接。此功能為用戶提供了無縫查詢外部數(shù)據(jù)源的能力,消除了數(shù)據(jù)遷移的需要。因此,用戶可以分析來自不同系統(tǒng)的數(shù)據(jù),例如 HDFS 和 Amazon S3,以各種文件格式,如 Parquet、ORC 和 CSV 等。

架構(gòu)選擇

StarRocks 支持共享無狀態(tài)(每個 BE 在其本地存儲上有一部分?jǐn)?shù)據(jù))和共享數(shù)據(jù)(所有數(shù)據(jù)在對象存儲或 HDFS 上,每個 CN 只有本地存儲上的緩存)。您可以根據(jù)需要決定數(shù)據(jù)存儲在哪里。

starrocks-架構(gòu).jpg

共享無狀態(tài)

本地存儲為實(shí)時查詢提供了更低的查詢延遲。

作為典型的大規(guī)模并行處理(MPP)數(shù)據(jù)庫,StarRocks 支持共享無狀態(tài)架構(gòu)。在這種架構(gòu)中,BE(Backend)負(fù)責(zé)數(shù)據(jù)存儲和計(jì)算。直接訪問 BE 模式中的本地?cái)?shù)據(jù)允許進(jìn)行本地計(jì)算,避免了數(shù)據(jù)傳輸和數(shù)據(jù)復(fù)制,并提供了超快的查詢和分析性能。該架構(gòu)支持多副本數(shù)據(jù)存儲,增強(qiáng)了集群處理高并發(fā)查詢的能力,并確保數(shù)據(jù)可靠性。它非常適合追求最佳查詢性能的場景。

共享數(shù)據(jù)

對象存儲和HDFS提供了成本、可靠性和可擴(kuò)展性的好處。除了存儲的可擴(kuò)展性之外,CN節(jié)點(diǎn)可以在不需重新平衡數(shù)據(jù)的情況下添加和刪除,因?yàn)榇鎯陀?jì)算是分開的。

在共享數(shù)據(jù)架構(gòu)中,BE 被替換為“計(jì)算節(jié)點(diǎn) (CN)”,這些節(jié)點(diǎn)只負(fù)責(zé)數(shù)據(jù)計(jì)算任務(wù)和緩存熱數(shù)據(jù)。數(shù)據(jù)存儲在像 Amazon S3、GCP、Azure Blob Storage、MinIO 等低成本且可靠的遠(yuǎn)程存儲系統(tǒng)中。當(dāng)緩存命中時,查詢性能與共享無狀態(tài)架構(gòu)相當(dāng)。CN 節(jié)點(diǎn)可以根據(jù)需要在幾秒鐘內(nèi)添加或移除。這種架構(gòu)降低了存儲成本,確保了更好的資源隔離,并具有高彈性和可擴(kuò)展性。

共享數(shù)據(jù)架構(gòu)與無共享架構(gòu)一樣保持簡單。它僅由兩種類型的節(jié)點(diǎn)組成:FE和CN。唯一的區(qū)別是用戶必須提供后端對象存儲。

  • PostgreSQL技術(shù)大講堂 - 第87講:重講系統(tǒng)安全和數(shù)據(jù)庫安全
  • PostgreSQL認(rèn)證培訓(xùn)推薦機(jī)構(gòu)
  • Oracle OCM證書有效期3年?這是個假消息
  • Oracle OCP證書有效期3年?與官方人員確認(rèn)這是個假消息
  • 2025年4月中國數(shù)據(jù)庫流行度排行榜:OceanBase超過PolarDB登頂
  • Apache Doris數(shù)據(jù)庫
  • 4月26日,工信部人才交流中心 & CUUG - PGCP+PGCM認(rèn)證考試完成!
  • Apache IoTDB
  • DolphinDB數(shù)據(jù)庫
  • Easysearch分布式搜索型數(shù)據(jù)庫
  • IvorySQL數(shù)據(jù)庫
  • NebulaGraph數(shù)據(jù)庫
  • OCP認(rèn)證考試指南:費(fèi)用、大綱、備考、題庫、證書及有效期全面解析
  • SelectDB數(shù)據(jù)庫
  • SourceDB數(shù)據(jù)庫
  • SQLite數(shù)據(jù)庫
  • StarRocks數(shù)據(jù)庫
  • SUNDB數(shù)據(jù)庫
  • TuGraph圖數(shù)據(jù)庫
  • 海量數(shù)據(jù)Vastbase數(shù)據(jù)庫
  • 華為云數(shù)據(jù)庫 GeminiDB
  • 華為云數(shù)據(jù)庫TaurusDB
  • 磐維數(shù)據(jù)庫PanWeiDB
  • 神舟通用數(shù)據(jù)庫
  • 實(shí)時數(shù)倉 Hologres
  • 天翼云數(shù)據(jù)庫TeleDB
  • 圖數(shù)據(jù)庫gStore
  • 星瑞格SinoDB數(shù)據(jù)庫管理系統(tǒng)
  • 虛谷xugudb數(shù)據(jù)庫
  • 云和恩墨MogDB數(shù)據(jù)庫
  • 云原生數(shù)據(jù)庫GaiaDB(蓋亞)
  • 2月22日,工信部人才交流中心 & CUUG - PGCP-PGCM認(rèn)證考試完成!
  • 考OCP認(rèn)證要交哪些費(fèi)用
  • Oracle OCP認(rèn)證沒落了嗎
  • openGauss數(shù)據(jù)庫
  • PingCAP TiDB數(shù)據(jù)庫
  • TDengine時序數(shù)據(jù)庫
  • 阿里云AnalyticDB云原生數(shù)據(jù)倉庫
  • 阿里云云原生數(shù)據(jù)庫PolarDB
  • 奧星貝斯OceanBase數(shù)據(jù)庫
  • 達(dá)夢數(shù)據(jù)庫管理系統(tǒng)DM8
  • 電科金倉KingbaseES數(shù)據(jù)庫管理系統(tǒng)
  • 華為GaussDB云數(shù)據(jù)庫
  • 金篆信科GoldenDB數(shù)據(jù)庫
  • 浪潮KaiwuDB數(shù)據(jù)庫
  • 南大通用GBASE數(shù)據(jù)庫
  • 騰訊云分布式數(shù)據(jù)庫TDSQL
  • 羲和 (Halo) 數(shù)據(jù)庫
  • 崖山 (YashanDB) 數(shù)據(jù)庫
  • 亞信安慧AntDB數(shù)據(jù)庫