鍾珊珊:被爆錘後的工程師會起飛|OneFlow U

語言: CN / TW / HK

鍾珊珊,一流科技工程師(實習),本科畢業於中山大學資訊管理與資訊系統專業,現在是中山大學計算機學院的準研究生。

大學期間,她擔任多個專案的主要負責人,並在資料驅動創新研究等高校大賽斬獲了一眾獎項,積累了技術實踐經驗。畢業後,在師兄師姐的推薦下,她來到 OneFlow 實習。 

她平時喜歡彈吉他,自稱彈得並不怎麼樣,但嘈嘈切切錯雜彈讓她感覺很自由、快樂、且放鬆。她似乎還有點隨性,大四時,她把 GPA 排名刷到了專業第一,但這時已經不評獎學金了;她選擇保研本校的中山大學計算機學院,是因為這樣搬宿舍不會太累…… 

以下是鍾珊珊自述。

中山大學的院系設定比較有趣,計算機學院、軟體學院、電子與資訊學院、智慧工程學院、人工智慧學院等都有 AI 方向的專業。其中,人工智慧學院在珠海校區,所以讀研我更傾向於在廣州的計算機學院,這樣的話,搬宿舍不用太累。 

大四時,我把 GPA 排名刷到了第一,但這時我們已經不評選獎學金了嗚嗚嗚……在學習上,我覺得多做筆記非常重要。當然,課本上的也不是都要一點不落地記下來,而是對課程中自己感興趣的點深入挖掘,多在課堂分享,多找老師討論。 

對我來說,學一項東西最快的方法是用以致學,直接上手。我的很多程式設計技能也是在本科時學的,如 JAVA、Matlab 等,還搞過 R 語言,反正雜七雜八的學了不少,但是真正習得程式設計技能還是靠實戰和興趣。 

例如參加“發現杯”軟體設計大賽的時候,速成後端知識完成專案。最有意思的是一些自己寫的小工具,以爬蟲為例,剛入門時找個看起來比較簡單的網站爬一爬,在爬的過程中遇到問題就解決問題,學到了很多東西。如果想要進階,找個看起來就不簡單的網站爬一爬,等 IP 被封的時候,就得另尋他法,把自己挖的坑努力填上:)

我還開發過一個自閉症預警模型,對百度貼吧自閉症吧的自閉症行為資料進行語義分析,提取自閉症典型特徵,實現自閉症預警,我主要負責資料爬取、特徵工程和微信小程式搭建。特徵工程部分基於 Python 實現 RNN、TextRank、Word2vec,對貼吧資料進行多層過濾和語義切分。    

我是從推薦演算法開始入門AI的,純粹的演算法一開始讓我很難理解這玩意要怎麼落地,所以中途跑去搞了一段時間的工程專案。在瞭解工程的基本結構和流程之後,我又將重心放回到演算法專案中,我的畢業論文就是做 NLP 方面的研究。而在 OneFlow 實習過程中,我接觸到一個全新的東西——運算元的實現,這讓我更加深入地理解運算元的執行機理,在模型效能測試的時候不會無從下手。

在校生如果要提升自己的能力,我認為需要有始有終,堅持下去總會有收穫,我就是在一路摸爬滾打中成長。

圖片

與 OneFlow 相識於師兄師姐的口口相傳中,據說是國產之光,但相比國內其他開源框架來說,OneFlow 的宣傳力度似乎屬於悶聲發大財?

OneFlow 可以遠端實習,為異地的實習生帶來巨大的便利。實際上,由於最近幾年的疫情,很多網際網路公司已經成功地實踐了遠端辦公,不用再為通勤、伙食等問題煩惱,而且只要工作安排得當,就可以很好地平衡生活和工作。 

前期我在雲平臺組,在遲哥的帶領下完成了 AI-Writer 專案,之後就來了框架組,目前在曉雨的指導下進行運算元的開發和維護工作。

剛來 OneFlow 時,我看不懂《如何在OneFlow中新增User Op》這個帖子,但當我仿照曉雨的 PR 實現一個運算元後,再回頭看這篇文章,就覺得它寫得棒極了。我還學會使用 MkDocs 和 GitHub 搭建網站(https://zhongshsh.github.io/BlogInOF) ,常常將重要 PR 的完成流程、踩坑經歷等梳理成網頁內容,以便需要時檢索使用。

在這裡實習是一件很快樂的事情,遠端辦公讓我少了通勤的煩惱,開源的思想讓我感受到大家協同工作的力量。同時,OneFlow 有很濃厚的學習氛圍,遲哥的夜校成功讓我速成 C++,有問題發個會議給曉雨,他能耐心解釋大半個小時,畢竟,這是一個搖 6 級地震也不忘 debug 的牛人。

由於工作原因,我既使用過 OneFlow,也參與到 OneFlow 的開發和維護中。我曾疑惑,OneFlow 的語法為啥和 PyTroch 一模一樣(OneFlow 程式設計 API 完全相容 PyTorch,常見深度學習模型只需修改一行 import oneflow as torch 就可以把在 PyTorch 寫的模型在 OneFlow 上跑起來),但是當我開始瞭解它的底層實現時,我又驚歎於 API 一模一樣背後的神奇速度。

目前,學術屆大多數人使用的仍然是 PyTorch,確實非常好用,而且由於社群很大,很容易搜到一些問題的解決方案。而曾經的行業巨頭 TensorFlow 的份額被步步蠶食。OneFlow 如果要達到 PyTorch 的高度,社群使用者的培養必不可少。

在 OneFlow 實習,很多東西都是從零開始學習,對我來說極具挑戰,尤其當完成某個 PR 的過程很艱澀時,我知道我可能要被爆錘,但這也意味著,我的個人能力也要坐著火箭起飛了。

歡迎下載體驗 OneFlow v0.7.0 最新版本: https://github.com/Oneflow-Inc/oneflow/