Amazon Redshift:十年持續重塑實時數倉能力再升級

語言: CN / TW / HK

「關注」「星標」 我們,

每天接收關於亞馬遜雲科技的 最新資訊

十年前 2012年11月,我們在 首屆亞馬遜雲科技re:Invent大會 上,釋出了 Amazon Redshift ,這是第一個完全託管、PB級的雲資料倉庫。相對於傳統的本地資料倉庫解決方案,Amazon Redshift的釋出徹底變革了行業的格局。

傳統的本地資料倉庫解決方案不僅 成本高、缺乏彈性 ,而且需要很高的調整和操作技術水平。

Amazon Redshift 的幫助下,使用現有商業智慧工具分析資料不僅 成本低廉 ,而且 簡單高效 。在釋出之後Amazon Redshift成為亞馬遜雲科技增長最快的服務之一。如今,全球範圍內,數以萬計的客戶在亞馬遜雲科技的中使用Redshift,每天用來處理EB級資料。

2013年,Amazon Redshift的主創成員在費城舉行的ACM頂級會議SIGMOD/PODS,釋出了論文《Amazon Redshift re-invented》

在過去的幾年裡, Amazon Redshif t 的用例已經發生變化。為應對這種變化,我們持續對Amazon Redsfhit進行 架構改進 ,來保持其 行業領先

通過 分層儲存、多叢集自動擴充套件、跨叢集資料共享 以及 AQUA查詢加速層 等創新,Redshift提高了儲存和計算的可擴充套件性。

Amazon Redshift Serverless 是雲原生資料倉庫架構創新的 集大成者 ,允許客戶在無需設定和管理資料倉庫基礎設施的情況下執行和擴充套件資料分析。Amazon Redshift通過獨有特性(例如 使用Spectrum查詢資料湖、Redshift ML )與亞馬遜雲科技雲服務進行廣泛整合與整合,使得它具備承擔超越傳統資料倉庫的使用場景對能力。

近日,亞馬遜雲科技推出 Amazon Redshift流式注入(Streaming Ingestion)功能預覽 ,讓客戶能夠直接從 Amazon Kinesis Data Streams (一項無伺服器流式資料服務,可簡化任何規模的資料流捕獲、處理和儲存)向Amazon Redshift資料倉庫中 注入實時資料並分析。

Amazon Redshift流式注入功能可以讓客戶無需在 Amazon Simple Storage Service(Amazon S3) 中暫存資料,直接將每秒數百兆的流資料接收到Amazon Redshift資料倉庫叢集並處理。

遊戲實時資料分析、線上廣告點選流分析、零售POS機資料流分析、應用日誌和網路日誌分析、物聯網裝置資料分析 等應用場景中,應用或者終端裝置會在短時間內持續生成巨量資料流。

這些資料流會被送到 Amazon Kinesis Data Streams 進行實時快取並最終使用Amazon Redshift完成資料分析。

以往,客戶如果想從Amazon Kinesis Data Streams向Amazon Redshift注入實時資料,需要先在Amazon S3中暫存資料,然後使用Copy命令載入資料來構建資料管道,這一過程通常需要 幾分鐘 才能完成。

但越來越多客戶希望能夠分析實時資料流以儘早獲得資料洞察。

Amazon Redshift流式注入功能的推出,滿足了客戶 真實資料流對資料處理規模和實時性的要求。

基於這一功能,客戶可以同時連線來自 多個Amazon Kinesis Data Streams的資料 ,將實時資料直接注入Amazon Redshift。客戶使用現有工具和熟悉的SQL執行下游處理和轉換,無需額外的成本,在幾秒鐘內從資料中獲得洞察。

Amazon Redshift流式注入 大幅簡化流式資料管道構建 ,加速資料處理,支援以低延遲、高吞吐量訪問資料倉庫中的實時資料,幫助資料工程師、資料分析師和大資料開發者將資料分析從“批量”轉向“實時”。 

目前,數以萬計的客戶每天使用Amazon Redshift處理EB級的資料,為高效能商業智慧(BI)報告、儀表板應用程式、資料探索和實時分析等分析工作負載提供支援。

Amazon Redshift流式注入功能的推出將進一步 豐富客戶的使用場景。 客戶可將流式資料實時分析與資料倉庫中的其它資料來源相結合,豐富和擴充套件實時分析應用場景。

例如, 遊戲運營人員 可以分析來自遊戲玩家的實時資料,優化遊戲體驗,提高轉化和留存率; 營銷部門 可以分析線上廣告的點選流資料,評估使用者足跡和行為,及時向客戶投放廣告; 分析人員 可以實時分析零售POS資料,實現零售交易的實時報告、分析和視覺化; 開發人員和工程師 可以實時分析應用程式日誌和網路日誌流資料,實時排除故障,採取預防措施,改善產品體驗。

客戶可以將 Amazon Redshift流式注入功能 Amazon Kinesis 服務一起使用,實時分析IoT資料,獲取裝置狀態和屬性(位置和感測器資料),監控應用程式,進行欺詐檢測,實現實時排行榜功能等等。

所有企業的大資料分析 需求都是動態 的,而大多數企業的資料戰略並不清晰。企業需要一套現代資料戰略提供 管理、訪問、分析和處理資料的全面規劃 ,以應對大資料分析需求的增長,並滿足當前和將來的分析用例。藉助 亞馬遜雲科技智慧湖倉架構 ,使用者可以快速構建可擴充套件的資料湖,使用廣泛而深入的專門構建資料服務組合,實現統一的資料訪問,保證資料安全和治理,以 低成本擴充套件系統 的同時而不損及效能,並 輕鬆跨組織邊界共享資料,進行快速、靈活地決策與資料分析

Amazon Redshift流式注入功能的推出,進一步 豐富了亞馬遜雲科技無伺服器分析產品服務不同客戶業務場景的能力 ,可以讓客戶無需配置、擴充套件或管理底層基礎設施,即可輕鬆地處理實時動態的資料同步,為機器學習專案提供兼具效能和成本效益的實時特徵資料準備。 也為企業打造現代化資料戰略,向資料驅動型企業邁進,提供了新的創新方向。

我們已在亞馬遜雲科技小程式上線了 Amazon Redshift的培訓課程 ,包含了 產品架構解讀、最佳實踐、應用場景、最新功能解讀與五個快速開始 的Demo

歡迎大家進入小程式學習瞭解

寵粉時間

小編為大家準備了小禮物

你對Amazon Redshift有什麼更多期待嗎?

歡迎在留言區分享你的想法

評論區點贊前三位送精美周邊哦~

馬上點選 “閱讀原文”

探索更多 Amazon Redshift 資訊

讓我們共同見證亞馬遜的一小步

雲端計算的一大步

別忘了"分享、在看、點贊 "三連喲~