不要迷信演算法,會變得無趣

語言: CN / TW / HK

在網際網路世界,近年來瀰漫著一股“演算法迷信”的風氣,並且有愈演愈烈之勢。

以位元組跳動的快速崛起為起點,尤其是大家提到抖音時,會理所當然地認為他們的祕密武器是儲存在伺服器裡那一行行神祕的程式碼。

這種迷信在去年TikTok的強制賣身風波中體現得淋漓盡致。當談判陷入僵局,有相當一部分競購方認為如果出售業務不帶有演算法,那麼毫無意義。

《華爾街日報》援引自訊息人員的說法是,沒有演算法的TikTok就如同用著廉價引擎的豪車。

但事實上,位元組內部關於機器學習推薦演算法並未取得多少外界未知的突破性進展。

雖然抖音並未在國內公佈他們的演算法是如何工作的,但為了自證清白,TikTok不僅向當地的監管機構和外部隱私專家開放了檢視程式碼的權利,還在洛杉磯建立了一個存放著所有資料流和程式碼的透明度及問責中心。

可我們至今都沒有找到任何關於個性化推薦演算法函式本身的顛覆性創意,美國市場上也沒有出現新的相關產品。那麼,APP工廠的真正優勢,到底在哪裡?

01 位元組系爆款真正的閃光點,在演算法友好型的UI設計上

過去二十年,科技產品的UI設計始終圍繞著如何消除使用者與他們的需求之間的摩擦。

在這個網路效應爆發式增長的時代,誰能設計出比競爭對手更好地滿足使用者需求的產品和服務,誰就能成為利用聚合理論獲得大量使用者群的科技巨頭。

這是一種寫在字裡行間的以使用者為中心。

拔地而起的科技公司,迅速過載的膨脹資訊,讓我們為使用者提供最好服務的關鍵,從洞察人們某種未被髮掘的需求變成了利用機器學習演算法實現對海量資料的篩選與過濾。

首先明確一個前提:ML演算法的訓練需要大量的資料集,任何一個Google或Facebook的演算法專家都沒辦法獨自訓練出一個高質量的推薦演算法。

這是否意味著所有全新垂類的APP都會被打上大廠的標籤?

大概率是這樣,但不全是。

自1998年亞馬遜推出基於專案的協同過濾演算法以來,它被改編和應用到了大部分網頁上,比如向人們推薦影片或新聞的演算法,以及各式各樣的網際網路廣告。

但作為個性化推薦的商業鼻祖,亞馬遜只有30%的網頁瀏覽量來自推薦系統,搜尋結果頁面目前仍是使用者下單的最主要路徑。

在這 個推 薦引擎中,系統正常運轉的前提是使用者過往的購買記錄、在商店瀏覽過的商品、已經新增到購物車裡的商品,以及一些以後可能會訂購的商品。

所有的一切都是基於使用者的搜尋行為。所以時至今日,我們依然會面臨在淘寶上搜索一次“花架”就一直被推薦花架的囚徒困境,而不是轉而詢問你需不需要一盆花。

可以明顯地感覺到,這類演算法永遠都處於“猜你喜歡”的狀態。因為當螢幕上同時展示多個專案時,它無法分辨出你的眼睛所注視的到底是哪個區域。就算能看到,因為沒有upvote/downvote的反饋設定,它也不可能知道這種關注是正面的還是負面的。

一言以蔽之,演算法對使用者情緒的判斷並不清晰。

然後我們再來看抖音的介面。

從影片開始播放的那一刻起,APP的UI設計會促使使用者立即開始思考一個問題:你怎麼看待眼前的這個影片?

1.你會在影片還沒播放完的時候就下滑進入下一個影片嗎?是的話就隱含表示你對它不感興趣。
2.你看完了它,還給影片漫不經心地點了個贊?
3.你在這個影片中停留了一陣子,甚至讓它迴圈播放了好幾次?
4.你通過內建的分享面板把這段影片分享給別人了嗎?
5.你是否點選了右下角旋轉的LP圖示,看了更多使用同款背景音樂的影片?
6.你開啟影片製作者的個人介面頁面了嗎? 是否觀看了他其他的影片?之後你關注這個人了嗎? 是的話,說明你除了喜歡這個影片之外,也許還特別喜歡這類人。

但這些都不屬於硬核的技術突破,而是來自UI方面的巧妙構思。

這種設計最大的特點,就是幫助使用者像演算法一樣看東西。

所以抖音的演算法比其他短影片APP學得更快。這一點非常重要,要知道,即使演算法本身同幾年前並沒有有太大差別,僅僅是在更大的資料集上進行訓練,就足以讓OpenAI開發出GPT-3這樣的模型。

在抖音之前,絕大部分短影片App都採用了微博式的介面,照搬圖文資訊流的展示方式,以縮圖的形式顯示影片,再加上幾個關鍵詞標籤或一段描述。

這種資訊展示的方式歷史悠久,適用面很廣,但是對演算法來說並不友好。

至於抖音設計巧思的來源,如果你恰巧使用過他們早期的版本,就會發現其介面、內容、調性與Musical.ly如出一轍。

據說張一鳴很早就洽談過收購musical.ly,後來未果才回國做了抖音。完成反向收購之後,位元組的後端演算法插入Musical.ly(現在的TikTok)的效果是顯著的,使用者時長很快就增長了一倍以上。

02 演算法推薦是重要的,但它並非全部

資訊展現方式一直是網際網路產品裡最基礎的部分,也是爭議最大的部分。

只是在技術至上的論調下被忽略了。

最常見的資訊展現方式有瀑布流,以及全屏。它們之間的區別在於一屏裡放多少內容合適。

按照張小龍在微信公 開課 上的說法,一屏裡的內容條數,跟命中率成反比。所以影片號上線後的前半年,採用半屏式的資訊流展現方式。後來在灰度半屏和全屏的使用者時,關注tab的使用者因為內容命中率不夠高,全屏後反而帶來了後臺清晰可見的選擇困難。

這是內容池深度的問題,與推薦演算法的調教無關。

這裡普及一個技術方面的常識:當底層召回內容資料不足時,演算法會從候選佇列中進行降級召回。

即本來演算法覺得使用者可能會喜歡內容A,但整個內容候選集中都沒有A的存在,只能遞補與A相近的B。

如果連B都沒有時,演算法會進一步做降級召回處理,或是直接按照熱度排序補充全域性熱門的內容給使用者。

從而帶來持續的惡性迴圈——被汙染了的演算法模型,會始終侷限在某個範圍內尋求帕累託次優解。

出於這樣的理由,我更願意相信影片號的全屏是出於內容積累到達某個臨界點後開始進入調教演算法的階段,而非所謂的對抖音的妥協。包括快手的精選tab,也是同樣的道理。

人們永遠可以爭論社交網路是由什麼組成的,但需要明確的一個前提是,大多數社交網路都採用一種漸進的方式來擴大規模。

鼓勵使用者與其他人互關,一次建立一個聯絡。為工具而來,為關係而留,這樣做唯一的問題就是速度太慢,而網際網路恰好是一個崇拜速度的地方。

只需要搜幾個關鍵詞,無需關注或與任何人成為好友,抖音就可以快速瞭解一個人的喜好。

我們姑且把它命名為一個圍繞興趣建立的娛樂網路。現階段,它是一個快速、高效的傳播媒介,因為這個網路不由關係連線,所以抖音博主的流量永遠不可能屬於個體。

很多人認為抖音商業化走在前面是因為廣告演算法好,但實際上抖音對遊戲廣告主的包容程度才是隱藏不言的奧祕,他們允許以單個付費使用者為單位結算,甚至可以約定“若使用者流失則退款”。

然而想靠這個設計留住使用者和增長並不現實(位元組國內的廣告收入趨於停滯已經證明了這件事)。中文網際網路的殘酷之處在於,任何UI設計都可以在一夜之間被同類產品模仿和複製,只要它被證明是有用的。

在這個機器學習佔據主流的時代,全屏的設計就是為了幫助演算法更快地去“看”這個世界。

但這並不意味著演算法是萬能的。因為直到今天,位元組都沒有辦法大規模地侵入長影片領域,即使張一鳴的戰略PPT上明明白白地寫著“只要在資訊分發領域,位元組都要用演算法來重新做一遍。”

即使抖音的UI設計讓他們的演算法迭代更快,也不可能做到篩選出人們行為資訊中的所有“噪聲”。有時,人們希望演算法再“聰明”一些,更理解自己;有時,人們並不願意重複看那些自己感興趣的內容,也想了解一點公共熱點;還有的時候,人們會想培養一些新的潛在興趣。

事實上,那些乏味重複、引起使用者輕微不快的內容才是產品的慢性殺手。如今,這些負面情緒正在抖音的APP裡緩慢發酵。

演算法今天不是,未來也不可能是萬能的。

舉一個最直觀的例子,不管是我們自己的優愛騰,還是海外那個演算法驅動的Netflix,內容消費都是以運營陣地和導航搜尋為第一生產力的。

因為決疑成本的巨大差異,長影片至今還保持著傳統貨架式的消費方式:

最新最熱的內容放在首頁曝光度最高的輪播欄;使用者依賴類目導航去查詢想要的內容,比如按照型別、地區、上映時間和評分來選擇電影;還有很大一部分消費來自於搜尋對應的站外決策。

比如在微博種草了某部電視劇,根據豆瓣評分來選擇觀看的電影,以及最近身邊的朋友們常常聊起的綜藝。

毫無疑問,演算法在長影片領域依然沒有佔據主導地位。

03 結語

當個性化推薦在某些領域大殺四方之時,我們總會不由自主地假設它佔據我們全部資訊場景的畫面;然而,現實卻是一個人在日常生活中接觸資訊的渠道,遠比他自己想象得要更加豐富。

假設一個初級電影愛好者想在週末看一部電影,會有幾種可能?

他可能直接開啟搜尋框,搜尋自己喜歡的演員或導演,看看他們還有哪些自己沒看過的作品;也可能開啟豆瓣,刷一刷有沒有自己感興趣的電影;當然,如果他有一個朋友恰好是發燒級的影迷,他可以直接請對方推薦幾部。

事實上,推薦、搜尋和社交是滿足人們不同需求的互補類工具,它們之間並沒有明確的替代關係。

演算法與編輯、社交併不對立,也不存在唯一的最優選。就像微信的演算法,一定有克服「社交情景崩潰」的成分,而今日頭條的內容稽核,也聘請了大量的人工編輯。

當我們站在科技與人文的交匯點去看這個世界,會發現每一種新技術都既是包袱又是恩賜,它永遠不會是非此即彼的結果,反倒比我們預想中的要更加複雜與深刻。

《楚門的世界》裡,創造者對楚門說:“外面的世界跟我給你的世界一樣的虛假,有一樣的謊言,一樣的欺詐。但在我的世界你什麼也不用怕,我比你更清楚你自己。”

楚門卻說:“You never had a camera in my head!” (你無法在我腦子裡裝一個攝像機)

儘管楚門的世界是假的,但楚門是真實的。所有計算好的下一刻,是行雲流水般的此世光陰。

參考資料

[1].取消演算法推薦,是技術上的倒退嗎?騰訊研究院,2021年

[2].Seeing Like an Algorithm,Eugene Wei,2020年

[3].演算法知識彙總:構成/學派/演算法,潘一鳴,2019年

[4].推薦演算法的“前世今生”,紙皮小火車,2019年

本文來自微信公眾號 “科技復聯汪”(ID:value_1984) ,作者:牧遙,36氪經授權釋出。