破浪人丨找資料如何更準更快?這個95年小哥哥有奇招~

語言: CN / TW / HK

說在前面

在揚帆破浪的2022年裡,有一批可愛的數帆同事在工作中、工作外憑熱愛發光發熱。

一個個小故事背後,呈現出他們在數字化技術與應用實踐中,步履不停的探索和開拓進取的力量。

今天是「破浪人」欄目第 1 期。

試想下,我們處理雜物時,一股腦兒把所有物品塞進一個大容量儲物櫃裡,但需要某件東西的時候,卻翻箱倒櫃都找不到?這是因為 缺少了關鍵步驟:對放入櫃子的東西進行統一分類和整理。

資料處理也是一樣。為了減少每次“找東西”的時間,需要利用好資料標準。

國內市場上已有成型的資料標準產品,但是同時 兼顧 資料標準本身的標準化描述、靈活的標準模板、靈活的管理流程配置、多樣化標準型別的產品 非常稀缺

去年,網易數帆的 95後小哥哥 產品經理安陽和他所在的團隊 成功研發出滿足以上需求的資料標準產品—— 有數資料標準產品 ,獲得多位客戶的高度認可。

安陽還憑藉此獲得 2021網易數帆內部評選的愛迪生獎 (這是獎勵最具創造力員工的專設獎項)。

左一為安陽在頒獎現場

資料治理,標準先行

資料標準有這麼重要嗎?還真有。

在數字經濟高速發展的今天,越來越多企業利用數字化技術提高運營效率,紛紛駛入數字化轉型的“快車道”。

儘管如此,很多企業還存在諸多問題:資料標準還停留在文件管理階段;未建立統一標準檢視,需要花費大量時間成本去認識資料;資料標準共享能力差,查詢週期長等。

例如,某企業需要對內部各業務系統的資料進行整合,但同一資料在不同系統中的不同描述,便是最大的“攔路虎”。比如對於“姓名”這個欄位,可以叫name,也可以叫xm;對於性別編碼,有的系統用0代表男,而有的系統則用1表示。

要篩選出有效資料,需要花費大量時間和人工成本,正確率難以保證。作為有著4-5年大資料行業經驗的“老產品人”,安陽很早便注意到這一市場痛點。

那麼,如何通俗地理解資料標準,其中又包含哪些內容?

安陽用工廠的流水化運作來形象類比。“假如把企業的資料平臺比作一個數據治理的工廠,原始資料需要經過一系列提煉才能變為有價值的資料資產, 資料標準就是定義每一步該怎麼做?准入條件是什麼、產出的要求是什麼?

不懂和客戶交流的不是好產品經理

談到有數資料標準有的優勢,安陽娓娓道來:

其一,標準度更高、靈活性更強。 我們的標準載體是參考GB/T 18391標準規範制定的資料元,管理流程參考了信通院釋出的資料標準管理白皮書,並支援自定義註冊模板配置,靈活性更強;

其二,提供多種標準挖掘方式。 提供多種標準挖掘方式。對於暫無發行標準的新型行業,會依據客戶是否有明確的標準要求,提供兩種不同的制定標準的方式;

其三,提供整包的釋出方式。 每次進行全量釋出,方便批量進行影響分析,及時通知相關方進行整改,標準執行及適配效率也得以提升。”

標準產品在有數大資料開發及管理平臺的位置

這一產品的順利研發及投入使用,除了有自身的經驗加持,還得益於安陽一次次 跟客戶的有效溝通。

去年11月,安陽和團隊在上海與某證券客戶討論資料治理的相關需求,“那天一聊就是4個多小時,結束時雙方都覺得意猶未盡。”

安陽也總結出心得:所有的設計規劃都應先考慮真實的場景,讓方案 更大程度地契合客戶需求 ,還要根據不同行業客戶的實際情況靈活考慮。

“不將就”才能創造出好產品

在專案初期,安陽遇到一個難題:團隊內大部分人對資料標準的理解還停留在概念階段。

為此,他開展了多場 培訓課 ,詳細講解了構成資料標準的每一個關鍵組成部分並舉例釋義,直到大家弄清楚為止。

資料標準的發展路線

“在研發過程中,大家的求知慾、專業能力讓我欽佩,良好的氛圍也帶動了我。我們多次討論可能存在的風險,保證資料標準產品的正常上線。最終 從規劃、研發到首個版本上線,只用了 短短 3個月 時間 。”

生活中,這個95年的小哥哥也是個妥妥的 “實幹派” ,平時喜歡研究心理學、文學甚至法語,閱讀對他進行使用者需求分析和撰寫工作文件很有幫助。烹飪、攝影樣樣拿手,週末下下廚,探探店,也是他最愛的放鬆方式。

對於資料標準產品的未來規劃方向,安陽表示,希望能夠建立標準資料治理體系, 以資料標準為核心 指導資料治理全鏈路,從階段標準化轉變到流程標準化,真正提升資料治理效率。

往期回顧:

全球僅83人,網易有數技術專家燕青成頂級開源專案Apache Spark 新晉Committer