小心,陌生網友給你的賬號打上“標籤”
撰稿丨千山
最近,有位同事給我推薦了一款叫做“原神玩家指示器”的拓展指令碼。傳說中,只要裝上這個指令碼,開啟任意一個B站影片,就可以識別出在評論區發言的網友是否為原神玩家。出於好奇,我試驗了一下,發現的確有點意思。
“原神玩家指示器”指令碼資訊截圖@Greasy Fork
初衷只是“做著玩”
這款“原神玩家指示器”釋出在一個專為使用者提供拓展指令碼的論壇Greasy Fork上。作者laupuz xu在公開留言中表示,此拓展指令碼主要應用於B站影片的評論區,安裝了該工具的使用者可以識別出發言的網友是否為原神玩家。
被標註為“原神玩家”的示意截圖@B站
依據動態裡是否有原神相關內容,通過指令碼篩選、符合條件的網友就會在其暱稱後被標註上“原神玩家”這幾個字。由於作者本人提到自己就是做著玩的、不太會更新迭代,而不足總是存在的,在後續發展中,一眾開發者就在此基礎上,將這個“指示器”玩出了花。
有的開發了能覆蓋B站、微博、知乎在內的多平臺升級版本,更多人跳出了遊戲圈,製作了能識別Vtuber的V圈指示器、能識別追星一族的飯圈指示器,甚至還有使用者可以自定義關鍵詞的指示器……..
以其中一款“新·三相之力指示器”為例,這個指示器主要作用在bilibili網頁版中,運作原理也是相似的:通過爬取使用者動態,在影片評論區的使用者ID後標註出他們的“成分”。所謂“三相”指的是原神、明日方舟和王者榮耀這三款大熱遊戲。作者對這段指令碼的說明是“B站評論區自動標註三相玩家,依據是動態裡是否有三相相關內容”。
我試著操作了一下,就收穫了一堆花花綠綠的“成分”字尾。比如,如果你在動態中沒有提到過這三項遊戲,指令碼就會在你的使用者名稱後標註“普通丨純良”;提到過“王者榮耀”,你就會被標註為紫色的“稀有 | 農批”。
被標註的使用者示意截圖@B站
如果既有“明日方舟”又有“原神”,那就成了紅色的“史詩 | 二次元雙象限”;假如三項都提過,那就會被標註為金色的“傳奇 | 三相之力”了。
被標註的使用者示意截圖@B站
不過,無論呈現效果有多麼花裡胡哨,這類指令碼的邏輯都比較簡單粗糙,依然有不少bug尚待消除。比如不少使用者都對【隱藏丨動態抽獎】的篩選機制表示迷惑,此外,還有很多人反饋了一些令人哭笑不得的烏龍現象——某些在動態中留下“還原神奇寶貝”等無關“原神”話題評論的人也會被標記為“原神玩家”。
可以說,這類指示器的娛樂性遠大於其功能性,但初衷只是“做著玩”的指令碼工具在一些後續發展中卻漸漸變了味。
灰色的“爬蟲”
在Greasy Fork上,隨手一搜就可以發現各種五花八門的指示器、“成分”檢測器。僅從技術實現來看,這類指令碼的開發並不複雜。它的核心奧義就是“爬蟲”技術。
常見的搜尋引擎大量使用的就是這種自動抓取網路資料的程式。曾幾何時,在大資料行業,爬蟲技術更是到了被濫用的地步,甚至有不少大資料公司利用爬蟲技術過度收集、非法竊取和販賣個人資料資訊。直到政策收緊和監管加強,這一亂象才被遏制。
爬蟲技術難度不高,技術本身也沒有善惡之分,關鍵還是在於使用者如何去用。 什麼資料能“爬”,什麼資料能“爬”但不該“爬”,使用者知不知情,同不同意,爬到的資料如何做到防竊取,這些問題都需要使用者的謹慎審視和判斷。但也正因為這些問題的答案很多時候都模稜兩可,所以“爬蟲”還是經常遊走於灰色地帶。
雖然隨著技術的進步,很多公司都開啟了反爬蟲功能來保護資料安全,但就某些社交娛樂平臺來說,使用者的轉評贊內容、頭像、暱稱、空間動態通常都屬於公開資訊,依然可以被爬蟲獲取。“原神玩家指示器”就是利用這一點,通過讀取社交平臺的API資料,抓取使用者在動態和評論中公開發布的資訊,再依照設定的匹配規則進行篩選。
使用者有時會主動分享自己的資料,獲得更優質的服務,達成更便捷的互動。但是,這個“度”如何界定?紅線要劃在哪兒?風險如何掌控?太多的疑問有待解決。
目前常用的應對策略是在網站根目錄下放置Robots協議。這一協議旨在建立爬取方和被爬取方之間關於爬取意願的通用且被遵守的技術規範。Robots協議通常會告訴網路搜尋引擎的漫遊器,哪些內容是不應被獲取的,哪些是可以被獲取的。嚴格按照Robots協議爬取網站相關資訊一般不會出現太大問題。
如果說Robots更像某種“君子協定”,那麼使用爬蟲技術的法律邊界又在哪裡呢?上海市檢察院第二分院第三檢察部副主任吳菊萍在公開發文中提到,網路爬蟲要體現並保持技術的中立性,可以從以下三個方面進行合法性限定:
其一,就爬取物件來說,應當限定為公開資料。
其二,就技術手段來說,網路爬蟲不應具有侵入性。是否具有侵入性應當從技術本身是否具有侵入性和資料爬取行為是否遵守爬蟲協議與合同約定兩個方面來判定。
其三,從爬取的目的來說,要具有正當性、合理性、公平性。
當然,大部分使用者認為指示器這類工具只是“圖個樂呵”,爬取的資料皆是公開資訊,並不牽涉利益目的,而且安裝指令碼的使用者規模也不大。如果安裝指令碼使用者量激增,對網站的正常運作產生了很大幹擾,引起了平臺方的注意,那麼開發者和使用者才可能面臨實質性的風險。
當我們被粗暴地“標籤”化
由“原神玩家指示器”的誕生引發的系列連鎖反應中,給陌生網友打標籤的動因頗為值得深究。形形色色的指示器通過自定義的關鍵詞來識別不同的群體,將網際網路陌生人進行群像化分類,對使用者而言,這種“成分”檢測簡單、粗暴,但又在一定程度上完成了某種社交“過濾”。
一方面,通過給他人打“標籤”遮蔽不想看的標籤內容和社交賬戶,就像如今各類社交平臺上常見的遮蔽和拉黑功能,只是這類指示器的篩選更為粗放;另一方面,對在社交媒體上與自己意見相左、好惡不一的陌生人給予一種標籤化的解釋,進而發出“原來他是XX人,怪不得......”之類的感嘆。
但深究一下,這種識別的手段何嘗不是另一種“傲慢”?分辨“道不同不相為謀”的物件,防止陷入無意義之爭的初衷沒問題,但通過給他人打標籤、戴帽子的手段進行鑑別,不過又是一種二極體思維的強化。此外,將看不慣的個人歸入某個群體,也會加深人們對某個標籤化群體的厭惡情緒。
當下的網際網路環境中,在對某件事發表觀點、展開討論的時候,首先關心的不是事件真相,而是先查詢對方的“成分”成了某種趨向,將對方納入某個標籤,似乎更有利於己方站在道德的高地。在試驗指示器指令碼的過程中,我發現已經有不少人指出了這種危險。
某個指示器的開發者如是說:
截圖@Greasy Fork
某指令碼討論區的使用者更是直言不諱:
截圖@Greasy Fork
紀錄片The Social Dilemma 中提到:“我們用網際網路技術創造了全球一整代人,他們成長的背景中,彼此之間的交流,文化中都滲透著操縱的鬼影。”標籤化可能就是網際網路思維對於人的一種異化。只要有賬號存在的地方,我們所見、所聞、所行、所買,凡是留下的痕跡都被視作資料,“喂”給演算法,機器通過tag分門別類,再進一步“投其所好”。如何避免習慣於這種馴化或許才是我們每個具體的人應該思考的問題。
參考連結:
https://www.pingwest.com/a/270659
https://baijiahao.baidu.com/s?id=1744114153150546502
https://view.inews.qq.com/a/20220704A07CS500
https://greasyfork.org/zh-CN
點選影片號卡片,立即 預約 直播
由於公眾號平臺改變了推送規則,如果你想多看到我們的文章,記得點一下在看和星標哦~
- 再見SIM卡,eSIM的時代終於要來了
- 小心,陌生網友給你的賬號打上“標籤”
- 羊了個羊太難了,它是真的不想讓你成功…
- 少兒程式設計是智商稅嗎?看了最新研究我有點困惑
- 再見 Sidecars,eBPF 能否扛起新大旗?
- 一個案例告訴你K8s 區塊鏈有多強悍
- 60多款App慘遭下架,大廠日子也不好過
- 發現一個漏洞給22萬?谷歌這次賞金計劃可信嗎
- 終於,Web2平臺可以實現Web3功能了!
- 千萬別小看軟體架構風格,很多大廠架構師都在使用!
- 32位應用已經涼了!
- 薪資漲幅最高!竟然是這門快“入土”的程式語言
- PyPi儲存庫遭惡意利用,儘快刪除這12個病毒包!
- Swift 與 Go:蘋果與谷歌的較量
- 全網公開IP屬地,你的位置“露餡”了
- Rust難懂?一文解讀其“所有權”和“借用”概念
- GitLab禁止員工使用Windows、推特確認540萬賬戶資料洩露、淘寶宣佈上線方言語音搜功能 | T資訊
- JMS有必要和Kafka硬剛嗎?
- 再見!英特爾宣佈將徹底關停這項業務
- Go語言負責人離職後,一門國產語言誕生了