從博士論文到被各大廠應用,Alluxio 如何走過 7 年創業路

語言: CN / TW / HK
從博士論文到被各大廠應用,Alluxio 如何走過7年創業路

今年 2 月,Alluxio 宣佈以實現收入同比增長 3 倍的成績結束了 2022 財年。“這個財年的業績進一步表明了市場需要更好的方法來訪問大規模分析和 AI/ML 應用程序中的數據,尤其是在分佈式混合雲和多雲環境中。”Alluxio 創始人兼 CEO 李浩源表示。

事實上,從當初一個論文項目到如今被市值最大的十家公司中的七家使用,李浩源用了九年的時間。那麼,Alluxio 這樣一個基礎軟件領域的創企,是如何從零成長至取得如今成績?Alluxio 又會如何應對當前動盪的市場呢?

起步:另闢蹊徑的數據架構

2000 年初期,大數據伴隨着互聯網的蓬勃發展應運而生,從而衍生出整個數據科技的發展。從宏觀角度看,數據科技可以分成兩層:上層的計算和下層的存儲。一直以來,存儲佔據了整個數據生命週期的絕大部分。

2013 年,北大畢業後來到伯克利攻讀博士學位的李浩源在準備畢業論文時,自然而然地想要做存儲相關的選題。但在調研了存儲行業的發展歷程後,李浩源發現,這個行業每 5~10 年就會發生一次革新,新產品取代上一代產品。同時,存儲市場極其分散,沒有一家企業的市場份額能佔到 25%以上,也沒有一款產品的數據存儲量能佔整個全球數據量的 5%以上。

有鑑於此,在存儲領域做到改變行業的顛覆性創新,在可預見的未來幾乎是不可能的。”李浩源説道,“但是,我們可以把存儲裏面的數據管理好,讓這些數據更好地來服務上層數據應用,從而提高整個社會效率。”

帶着這個想法,李浩源提出了一種新的架構,即將虛擬分佈式文件系統(Virtual Distibuted File Syestem)作為計算層和存儲層之間的新層,為上層 Spark、Presto、Tensorflow、Pytorch 等計算框架提供服務。

這就是李浩源的博士論文《虛擬分佈式文件系統》研究的主題。這個項目在當時被稱為 Tachyon,也是如今 Alluxio 的前身。

伯克利大學一直有開源的傳統,李浩源順應了這一傳統,在第一時間將這個項目開源。開源後,李浩源發現整個技術演進路線的確在往其預想的方向發展,項目也有了越來越多的用户,收到了越來越多業界的正向反饋。

不過,要想實現更宏大的願景就需要更加體系化的公司化運營,因此,2015 年,李浩源選擇了創業。

創業初期,很多事情都要李浩源親力親為,但最重要的還是按照規劃把產品打磨到 1.0 版本。“我們要把代碼寫好,大家對代碼有了反饋後去進行支持或迴應,把產品打磨的越來越好。”李浩源説道。

2016 年,Alluxio 1.0 版本正式發佈,這是首個以內存為中心的虛擬分佈式存儲系統,統一了數據訪問的方式,在上層計算框架和底層存儲系統之間搭建了橋樑。

與此同時,Alluxio 開源社區也在不斷髮展。社區日常管理由 PMC(項目管理委員會)負責。而在有了更多用户後,李浩源開始把更多時間用在與用户和開發者交流上,希望參與進來的人可以為社區做出貢獻。據悉,Alluxio 目前在 GitHub 上的貢獻者已超過 1,200 人,社區 Slack 頻道成員接近 10,000 人。

開源助力商業化

產品逐漸成熟後,Alluxio 開始進入商業化階段。早期沒有客户時候的商業化很難,但好在 Alluxio 的開源社區獲得了一些行業和社區的認可,因此當這些開發者有需求的時候便會主動找到 Alluxio。李浩源也很重視與潛在用户的交流,幫助解決用户具體痛點,建立信任後再進行更大的合作。這樣的方式,幫助 Alluxio 完成了早期用户積累。

Alluxio 的商業化模型與其他開源產品差不多,都是在開源版本基礎上添加商業化功能,並以付費的企業版輸出,企業版根據客户使用的節點情況收取費用。

據悉, Alluxio 企業版在全球市場客單價從幾十萬美元到數百萬美元規模不等,客户多集中在科技、金融、電信等行業。李浩源此前表示,Alluxio 90%的客户都是全球五百強,產品已經得到很好的市場驗證。

隨着企業的發展,李浩源開始將精力放在為公司的整體發展和方向做出決策,以確保制定最為有效的戰略,讓公司成長為一家全球領先的企業。

實際上,自 Alluxio 創立以來,數據生態系統發生了巨大的變化,越來越多的企業開始上雲。與在傳統數據倉庫中提供託管分析工作不同,雲中的數據服務變得更加遙遠(如從 S3 傳輸)、孤立(如分佈在多個不同的區域或存儲服務中),並且通常在性能上存在很大差異。

為此,在 2019 年的紐約 AWS 峯會上,Alluxio 發佈了大版本 2.0,針對多雲增加了多項功能,包括支持跨本地和任意數量雲進行自動數據分層等,還為雲計算優化數據訪問、與 AWS Elastic Map Reduce (EMR) 服務集成等。

而最近發佈的2.9版本增加了跨環境集羣同步功能,支持橫向擴展的多租户架構,顯著改進在 Kubernetes 上部署的工具集和指南,增強 Alluxio 的易管理性,並通過優化 S3 API 和 POSIX API 實現安全性和性能提升。

如今,全球頭部互聯網企業 Facebook、Airbnb、Uber、阿里巴巴、騰訊和字節跳動等已經在生產環境裏部署了 Alluxio 的軟件系統;全球前六名的雲廠商中有五家雲廠商已經嵌入了 Alluxio 的技術;全球前兩名的芯片廠商英特爾、英偉達也在使用 Alluxio。

同時,Alluxio 也正在全球擴大目標市場規模和研發運營覆蓋範圍,其中包括大力拓展國內市場業務,將北京設立為中國區總部,併成立本地化的研發團隊。今年 9 月,Alluxio 還與北京大學計算機學院簽署產學研合作框架協議。

如何“過冬”

作為創業公司,Alluxio 在科研方面一直在進行大量投入,員工人數相比之前也實現了三倍增長,並且還在進一步擴大公司執行管理團隊等。這些投入的背後主要來自 Alluxio 自身快速增長的營收和投資人的支持。

一方面,Alluxio 在前年營收實現了同比 3.5 倍的增長,去年實現 3 倍增長。另一方面,Alluxio 一步步兑現甚至超額完成預期也得到了投資人堅定支持,比如 a16z 一直在加磅 Alluxio。

不過當前受疫情影響,資本進入“寒冬”,全球企業都在面臨着一場生死“大考”,Alluxio 也不例外。對此,李浩源的應對之道就是“練內功”。

“在市場動盪的情況下,企業更多還是要做好核心根基。正所謂‘集中力量練內功’,本質上就是把核心產品做得更好,為你的核心客户帶來更多的價值,讓已有客户更滿意,在此基礎之上再擴張。”李浩源補充道,“這也是 Alluxio 一直以來的發展策略。”

結束語

未來,Alluxio 將繼續加強對大規模數據分析、人工智能技術的支持,通過加強與 Kubernetes  的整合等方式,優化用户使用體驗。而對於其進一步深入擴展全球市場能做出什麼樣的成績,李浩源很有信心。

“兵來將擋,水來土掩,面對未來的種種困難,只要一一處理就好了。”李浩源説道。

 

內容轉載自:InfoQ
作者:褚杏娟

想要了解更多關於Alluxio的乾貨文章、熱門活動、專家分享,可點擊進入【Alluxio智庫】