什麼是整潔的程式碼

2019-08-25 23:37:19

(給演算法愛好者加星標,修煉程式設計內功

作者:xybaby

https://www.cnblogs.com/xybaby/p/11335829.html

寫出整潔的程式碼,是每個程式設計師的追求。《clean code》指出,要想寫出好的程式碼,首先得知道什麼是骯髒程式碼、什麼是整潔程式碼;然後通過大量的刻意練習,才能真正寫出整潔的程式碼。


WTF/min是衡量程式碼質量的唯一標準,Uncle Bob在書中稱糟糕的程式碼為沼澤(wading),這隻突出了我們是糟糕程式碼的受害者。國內有一個更適合的詞彙:屎山,雖然不是很文雅但是更加客觀,程式設計師既是受害者也是加害者。


對於什麼是整潔的程式碼,書中給出了大師們的總結:


  • Bjarne Stroustrup:優雅且高效;直截了當;減少依賴;只做好一件事

  • Grady booch:簡單直接

  • Dave thomas:可讀,可維護,單元測試

  • Ron Jeffries:不要重複、單一職責,表達力(Expressiveness)


其中,我最喜歡的是表達力(Expressiveness)這個描述,這個詞似乎道出了好程式碼的真諦:用簡單直接的方式描繪出程式碼的功能,不多也不少。


命名的藝術


坦白的說,命名是一件困難的事情,要想出一個恰到好處的命名需要一番功夫,尤其我們的母語還不是程式語言所通用的英語。不過這一切都是值得了,好的命名讓你的程式碼更直觀,更有表達力。


好的命名應該有下面的特徵:


名副其實


好的變數名告訴你:是什麼東西,為什麼存在,該怎麼使用


如果需要通過註釋來解釋變數,那麼就先得不那麼名副其實了。


下面是書中的一個示例程式碼,展示了命名對程式碼質量的提升


# bad codedef getItem(theList):   ret = []   for x in theList:      if x[0] == 4:         ret.append(x)   return ret
# good codedef getFlaggedCell(gameBoard): '''掃雷遊戲,flagged:翻轉''' flaggedCells = [] for cell in gameBoard: if cell.IsFlagged(): flaggedCells.append(cell) return flaggedCells

避免誤導


  • 不要掛羊頭賣狗肉

  • 不要覆蓋慣用縮略語


這裡不得不吐槽前兩天才看到的一份程式碼,居然使用了 l 作為變數名;而且,user居然是一個list(單複數都沒學好!!)


有意義的區分


程式碼是寫給機器執行,也是給人閱讀的,所以概念一定要有區分度


# baddef copy(a_list, b_list):    pass    # gooddef copy(source, destination):    pass


使用讀的出來的單詞

如果名稱讀不出來,那麼討論的時候就會像個傻鳥

使用方便搜尋的命名

名字長短應與其作用域大小相對應

避免思維對映


比如在程式碼中寫一個temp,那麼讀者就得每次看到這個單詞的時候翻譯成其真正的意義


註釋


有表達力的程式碼是無需註釋的。

The proper use of comments is to compensate for our failure to express ourself in code.

註釋的適當作用在於彌補我們用程式碼表達意圖時遇到的失敗,這聽起來讓人沮喪,但事實確實如此。The truth is in the code, 註釋只是二手資訊,二者的不同步或者不等價是註釋的最大問題。


書中給出了一個非常形象的例子來展示:用程式碼來闡述,而非註釋


bad// check to see if the employee is eligible for full benefitif ((employee.flags & HOURLY_FLAG) && (employee.age > 65))
goodif (employee.isEligibleForFullBenefits())


因此,當想要添加註釋的時候,可以想想是否可以通過修改命名,或者修改函式(程式碼)的抽象層級來展示程式碼的意圖。


當然,也不能因噎廢食,書中指出了以下一些情況屬於好的註釋


  1. 法務資訊

  2. 對意圖的註釋,為什麼要這麼做

  3. 警示

  4. TODO註釋

  5. 放大看似不合理之物的重要性


其中個人最贊同的是第2點和第5點,做什麼很容易通過命名錶達,但為什麼要這麼做則並不直觀,特別涉及到專業知識、演算法的時候。另外,有些第一感覺“不那麼優雅”的程式碼,也許有其特殊願意,那麼這樣的程式碼就應該加上註釋,說明為什麼要這樣,比如為了提升關鍵路徑的效能,可能會犧牲部分程式碼的可讀性。


最壞的註釋就是過時或者錯誤的註釋,這對於程式碼的維護者(也許就是幾個月後的自己)是巨大的傷害,可惜除了code review,並沒有簡單易行的方法來保證程式碼與註釋的同步。


函式


函式的單一職責


一個函式應該只做一件事,這件事應該能通過函式名就能清晰的展示。判斷方法很簡單:看看函式是否還能再拆出一個函式。

函式要麼做什麼do_sth, 要麼查詢什麼query_sth。最噁心的就是函式名錶示只會query_sth, 但事實上卻會do_sth, 這使得函式產生了副作用。比如書中的例子


public class UserValidator {    private Cryptographer cryptographer;    public boolean checkPassword(String userName, String password) {         User user = UserGateway.findByName(userName);        if (user != User.NULL) {            String codedPhrase = user.getPhraseEncodedByPassword();             String phrase = cryptographer.decrypt(codedPhrase, password);             if ("Valid Password".equals(phrase)) {                Session.initialize();                return true;             }        }        return false;     }}


函式的抽象層級


每個函式一個抽象層次,函式中的語句都要在同一個抽象層級,不同的抽象層級不能放在一起。比如我們想把大象放進冰箱,應該是這個樣子的:


def pushElephantIntoRefrige():    openRefrige()    pushElephant()    closeRefrige()


函式裡面的三句程式碼在同一個層級(高度)描述了要完成把大象放進冰箱這件事順序相關的三個步驟。顯然,pushElephant這個步驟又可能包含很多子步驟,但是在pushElephantIntoRefrige這個層級,是無需知道太多細節的。


當我們想通過閱讀程式碼的方式來了解一個新的專案時,一般都是採取廣度優先的策略,自上而下的閱讀程式碼,先了解整體結構,然後再深入感興趣的細節。如果沒有對實現細節進行良好的抽象(並凝練出一個名副其實的函式),那麼閱讀者就容易迷失在細節的汪洋裡。


某種程度看來,這個跟金字塔原理也很像


每一個層級都是為了論證其上一層級的觀點,同時也需要下一層級的支援;同一層級之間的多個論點又需要以某種邏輯關係排序。pushElephantIntoRefrige就是中心論點,需要多個子步驟的支援,同時這些子步驟之間也有邏輯先後順序。


函式引數


函式的引數越多,組合出的輸入情況就愈多,需要的測試用例也就越多,也就越容易出問題。


輸出引數相比返回值難以理解,這點深有同感,輸出引數實在是很不直觀。從函式呼叫者的角度,一眼就能看出返回值,而很難識別輸出引數。輸出引數通常逼迫呼叫者去檢查函式簽名,這個實在不友好。


向函式傳入Boolean(書中稱之為 Flag Argument)通常不是好主意。尤其是傳入True or False後的行為並不是一件事情的兩面,而是兩件不同的事情時。這很明顯違背了函式的單一職責約束,解決辦法很簡單,那就是用兩個函式。

Dont repear yourself


在函式這個層級,是最容易、最直觀實現複用的,很多IDE也難幫助我們講一段程式碼重構出一個函式。


不過在實踐中,也會出現這樣一種情況:一段程式碼在多個方法中都有使用,但是又不完全一樣,如果抽象成一個通用函式,那麼就需要加引數、加if else區別。這樣就有點尷尬,貌似可以重構,但又不是很完美。


造成上述問題的某種情況是因為,這段程式碼也違背了單一職責原則,做了不只一件事情,這才導致不好複用,解決辦法是進行方法的細分,才能更好複用。也可以考慮template method來處理差異的部分。


測試


非常慚愧的是,在我經歷的專案中,測試(尤其是單元測試)一直都沒有得到足夠的重視,也沒有試行過TDD。正因為缺失,才更感良好測試的珍貴。


我們常說,好的程式碼需要有可讀性、可維護性、可擴充套件性,好的程式碼、架構需要不停的重構、迭代,但自動化測試是保證這一切的基礎,沒有高覆蓋率的、自動化的單元測試、迴歸測試,誰都不敢去修改程式碼,只能任其腐爛。


即使針對核心模組寫了單元測試,一般也很隨意,認為這只是測試程式碼,配不上生產程式碼的地位,以為只要能跑通就行了。這就導致測試程式碼的可讀性、可維護性非常差,然後導致測試程式碼很難跟隨生產程式碼一起更新、演化,最後導致測試程式碼失效。所以說,髒測試 - 等同於 - 沒測試。


因此,測試程式碼的三要素:可讀性,可讀性,可讀性。


對於測試的原則、準則如下:


  • You are not allowed to write any production code unless it is to make a failing unit test pass. 沒有測試之前不要寫任何功能程式碼

  • You are not allowed to write any more of a unit test than is sufficient to fail; and compilation failures are failures. 只編寫恰好能夠體現一個失敗情況的測試程式碼

  • You are not allowed to write any more production code than is sufficient to pass the one failing unit test. 只編寫恰好能通過測試的功能程式碼


測試的FIRST準則:


  1. 快速(Fast)測試應該夠快,儘量自動化。

  2. 獨立(Independent) 測試應該應該獨立。不要相互依賴

  3. 可重複(Repeatable) 測試應該在任何環境上都能重複通過。

  4. 自我驗證(Self-Validating) 測試應該有bool輸出。不要通過檢視日誌這種低效率方式來判斷測試是否通過

  5. 及時(Timely) 測試應該及時編寫,在其對應的生產程式碼之前編寫



推薦閱讀

(點選標題可跳轉閱讀)

原始碼受美國出口管控麼?要提前囤程式碼麼?看完有答案

13 年來,我寫了這些糟糕的遊戲程式碼



覺得本文有幫助?請分享給更多人

關注「演算法愛好者」加星標,修煉程式設計內功

好文章,我在看❤️

已同步到看一看



熱點新聞