從博士論文到被各大廠應用,Alluxio 如何走過 7 年創業路

語言: CN / TW / HK
從博士論文到被各大廠應用,Alluxio 如何走過7年創業路

今年 2 月,Alluxio 宣佈以實現收入同比增長 3 倍的成績結束了 2022 財年。“這個財年的業績進一步表明了市場需要更好的方法來訪問大規模分析和 AI/ML 應用程式中的資料,尤其是在分散式混合雲和多雲環境中。”Alluxio 創始人兼 CEO 李浩源表示。

事實上,從當初一個論文專案到如今被市值最大的十家公司中的七家使用,李浩源用了九年的時間。那麼,Alluxio 這樣一個基礎軟體領域的創企,是如何從零成長至取得如今成績?Alluxio 又會如何應對當前動盪的市場呢?

起步:另闢蹊徑的資料架構

2000 年初期,大資料伴隨著網際網路的蓬勃發展應運而生,從而衍生出整個資料科技的發展。從巨集觀角度看,資料科技可以分成兩層:上層的計算和下層的儲存。一直以來,儲存佔據了整個資料生命週期的絕大部分。

2013 年,北大畢業後來到伯克利攻讀博士學位的李浩源在準備畢業論文時,自然而然地想要做儲存相關的選題。但在調研了儲存行業的發展歷程後,李浩源發現,這個行業每 5~10 年就會發生一次革新,新產品取代上一代產品。同時,儲存市場極其分散,沒有一家企業的市場份額能佔到 25%以上,也沒有一款產品的資料儲存量能佔整個全球資料量的 5%以上。

有鑑於此,在儲存領域做到改變行業的顛覆性創新,在可預見的未來幾乎是不可能的。”李浩源說道,“但是,我們可以把儲存裡面的資料管理好,讓這些資料更好地來服務上層資料應用,從而提高整個社會效率。”

帶著這個想法,李浩源提出了一種新的架構,即將虛擬分散式檔案系統(Virtual Distibuted File Syestem)作為計算層和儲存層之間的新層,為上層 Spark、Presto、Tensorflow、Pytorch 等計算框架提供服務。

這就是李浩源的博士論文《虛擬分散式檔案系統》研究的主題。這個專案在當時被稱為 Tachyon,也是如今 Alluxio 的前身。

伯克利大學一直有開源的傳統,李浩源順應了這一傳統,在第一時間將這個專案開源。開源後,李浩源發現整個技術演進路線的確在往其預想的方向發展,專案也有了越來越多的使用者,收到了越來越多業界的正向反饋。

不過,要想實現更巨集大的願景就需要更加體系化的公司化運營,因此,2015 年,李浩源選擇了創業。

創業初期,很多事情都要李浩源親力親為,但最重要的還是按照規劃把產品打磨到 1.0 版本。“我們要把程式碼寫好,大家對程式碼有了反饋後去進行支援或迴應,把產品打磨的越來越好。”李浩源說道。

2016 年,Alluxio 1.0 版本正式釋出,這是首個以記憶體為中心的虛擬分散式儲存系統,統一了資料訪問的方式,在上層計算框架和底層儲存系統之間搭建了橋樑。

與此同時,Alluxio 開源社群也在不斷髮展。社群日常管理由 PMC(專案管理委員會)負責。而在有了更多使用者後,李浩源開始把更多時間用在與使用者和開發者交流上,希望參與進來的人可以為社群做出貢獻。據悉,Alluxio 目前在 GitHub 上的貢獻者已超過 1,200 人,社群 Slack 頻道成員接近 10,000 人。

開源助力商業化

產品逐漸成熟後,Alluxio 開始進入商業化階段。早期沒有客戶時候的商業化很難,但好在 Alluxio 的開源社群獲得了一些行業和社群的認可,因此當這些開發者有需求的時候便會主動找到 Alluxio。李浩源也很重視與潛在使用者的交流,幫助解決使用者具體痛點,建立信任後再進行更大的合作。這樣的方式,幫助 Alluxio 完成了早期使用者積累。

Alluxio 的商業化模型與其他開源產品差不多,都是在開源版本基礎上新增商業化功能,並以付費的企業版輸出,企業版根據客戶使用的節點情況收取費用。

據悉, Alluxio 企業版在全球市場客單價從幾十萬美元到數百萬美元規模不等,客戶多集中在科技、金融、電信等行業。李浩源此前表示,Alluxio 90%的客戶都是全球五百強,產品已經得到很好的市場驗證。

隨著企業的發展,李浩源開始將精力放在為公司的整體發展和方向做出決策,以確保制定最為有效的戰略,讓公司成長為一家全球領先的企業。

實際上,自 Alluxio 創立以來,資料生態系統發生了巨大的變化,越來越多的企業開始上雲。與在傳統資料倉庫中提供託管分析工作不同,雲中的資料服務變得更加遙遠(如從 S3 傳輸)、孤立(如分佈在多個不同的區域或儲存服務中),並且通常在效能上存在很大差異。

為此,在 2019 年的紐約 AWS 峰會上,Alluxio 釋出了大版本 2.0,針對多雲增加了多項功能,包括支援跨本地和任意數量雲進行自動資料分層等,還為雲端計算優化資料訪問、與 AWS Elastic Map Reduce (EMR) 服務整合等。

而最近釋出的2.9版本增加了跨環境叢集同步功能,支援橫向擴充套件的多租戶架構,顯著改進在 Kubernetes 上部署的工具集和指南,增強 Alluxio 的易管理性,並通過優化 S3 API 和 POSIX API 實現安全性和效能提升。

如今,全球頭部網際網路企業 Facebook、Airbnb、Uber、阿里巴巴、騰訊和位元組跳動等已經在生產環境裡部署了 Alluxio 的軟體系統;全球前六名的雲廠商中有五家雲廠商已經嵌入了 Alluxio 的技術;全球前兩名的晶片廠商英特爾、英偉達也在使用 Alluxio。

同時,Alluxio 也正在全球擴大目標市場規模和研發運營覆蓋範圍,其中包括大力拓展國內市場業務,將北京設立為中國區總部,併成立本地化的研發團隊。今年 9 月,Alluxio 還與北京大學計算機學院簽署產學研合作框架協議。

如何“過冬”

作為創業公司,Alluxio 在科研方面一直在進行大量投入,員工人數相比之前也實現了三倍增長,並且還在進一步擴大公司執行管理團隊等。這些投入的背後主要來自 Alluxio 自身快速增長的營收和投資人的支援。

一方面,Alluxio 在前年營收實現了同比 3.5 倍的增長,去年實現 3 倍增長。另一方面,Alluxio 一步步兌現甚至超額完成預期也得到了投資人堅定支援,比如 a16z 一直在加磅 Alluxio。

不過當前受疫情影響,資本進入“寒冬”,全球企業都在面臨著一場生死“大考”,Alluxio 也不例外。對此,李浩源的應對之道就是“練內功”。

“在市場動盪的情況下,企業更多還是要做好核心根基。正所謂‘集中力量練內功’,本質上就是把核心產品做得更好,為你的核心客戶帶來更多的價值,讓已有客戶更滿意,在此基礎之上再擴張。”李浩源補充道,“這也是 Alluxio 一直以來的發展策略。”

結束語

未來,Alluxio 將繼續加強對大規模資料分析、人工智慧技術的支援,通過加強與 Kubernetes  的整合等方式,優化使用者使用體驗。而對於其進一步深入擴充套件全球市場能做出什麼樣的成績,李浩源很有信心。

“兵來將擋,水來土掩,面對未來的種種困難,只要一一處理就好了。”李浩源說道。

 

內容轉載自:InfoQ
作者:褚杏娟

想要了解更多關於Alluxio的乾貨文章、熱門活動、專家分享,可點選進入【Alluxio智庫】