Github上10個開源好用的人臉識別資料集

語言: CN / TW / HK

在本文中,我們列出了 10 個可用於啟動人臉識別專案的人臉資料集。

1| Flickr-Faces-HQ 資料集 (FFHQ)

Flickr-Faces-HQ 資料集(FFHQ)是一個由人臉組成的資料集,在年齡、種族和影象背景方面比 CELEBA-HQ 資料集包含更多的變化,並且對眼鏡、太陽鏡、帽子等配飾的覆蓋範圍也更好。影象是從 Flickr 抓取的,然後自動對齊和裁剪。

大小:資料集由 70,000 張 1024×1024 解析度的高質量 PNG 影象組成,並且在年齡、種族和影象背景方面包含相當大的變化。

專案:該資料集最初是作為生成對抗網路 (GAN) 的基準建立的。

2| Tufts-Face人臉資料庫

Tufts 人臉資料庫是最全面的大規模人臉資料集,包含 7 種影象模式:可見光、近紅外、熱、計算機草圖、LYTRO、錄製的影片和 3D 影象。

大小:資料集包含超過 10,000 張影象,其中包括來自 15 個以上國家的 74 名女性和 38 名男性,年齡範圍在 4 至 70 歲之間。

專案:該資料庫可供全球研究人員使用,以便對草圖、熱、NIR、3D 人臉識別和異性戀人臉識別的面部識別演算法進行基準測試。

3| 真假人臉檢測

該資料集包含專家生成的高質量 photoshopped 人臉影象,其中影象由不同的人臉合成,由眼睛、鼻子、嘴巴或整張臉分開。

大小:資料集大小為215MB

專案:此資料集可用於區分真假影象。

4| Google面部表情比較資料集

谷歌的這個資料集是一個大規模的面部表情資料集,它由人臉影象三元組和指定的人類註釋組成,每個三元組中的兩個人臉在面部表情方面形成最相似的一對。

大小:資料集大小為 200MB,其中包括 500K 三元組和 156K 人臉影象。

專案:該資料集旨在幫助研究人員研究與面部表情分析相關的主題,例如基於表情的影象檢索、基於表情的相簿摘要、情感分類、表情合成等。

5| 帶有標記的地標點的人臉影象

Face Images with Marked Landmark Points 是一個 Kaggle 資料集,用於預測人臉影象上的關鍵點位置。

大小:資料集大小為 497MP,包含 7049 張人臉影象和多達 15 個標記在其上的關鍵點。

專案:該資料集可用作多個應用程式的構建塊,例如跟蹤影象和影片中的人臉、分析面部表情、檢測畸形面部跡象以進行醫學診斷和生物識別或面部識別。

6| 野外家園 (LFW) 資料集中的標記人臉

野外標記人臉 (LFW) 資料集是一個人臉照片資料庫,旨在研究無約束人臉識別問題。 Labeled Faces in the Wild 是人臉驗證的公共基準,也稱為配對匹配。

大小:資料集的大小為 173MB,它包含從網路收集的 13,000 多張人臉影象。

專案:資料集可用於人臉驗證和其他形式的人臉識別。

7| UTKFace 大規模人臉資料集

UTKFace 資料集是一個年齡跨度大的大規模人臉資料集,年齡範圍從 0 到 116 歲。 這些影象涵蓋了姿勢、面部表情、光照、遮擋、解析度等方面的巨大變化。

大小:資料集包含超過 2 萬張帶有年齡、性別和種族註釋的影象。

專案:該資料集可用於各種任務,例如面部檢測、年齡估計、年齡進展、年齡迴歸、地標定位等。

8| 帶有面部關鍵點的YouTubeFaces資料集

該資料集是 YouTube Faces Dataset 的處理版本,主要包含公開可用並從油管下載的名人短影片。 每個名人都有多個影片(每個名人最多 6 個影片)。

大小:資料集大小為10GB,包含大約1293個影片,每個原始影片最多240幀的連續幀。 整個單幅影象幀共有 155,560 張影象。

專案:該資料集可用於識別無約束影片中的人臉。

9| 大規模 CelebFaces 屬性 (CelebA) 資料集

CelebFaces Attributes Dataset (CelebA) 是一個大規模的人臉屬性資料集,擁有超過 200K 的名人影象,每個影象有 40 個屬性註釋。 該資料集中的影象涵蓋了大的姿勢變化和背景雜波。

大小:資料集大小為 200K,其中包括 10177 個身份,202599 個人臉影象,5 個地標位置,每張影象 40 個二進位制屬性註釋。

專案:該資料集可用作以下計算機視覺任務的訓練和測試集:人臉屬性識別、人臉檢測、地標(或面部部分)定位以及人臉編輯和合成。

10| 耶魯人臉資料庫

耶魯人臉資料庫包含 15 個人的 165 張 GIF 格式的灰度影象。 每個主體有 11 張影象,每種不同的面部表情或配置各一張:中心光、帶眼鏡、快樂、左光、不帶眼鏡、正常、右光、悲傷、睏倦、驚訝和眨眼。

大小:資料集的大小為 6.4MB,包含 5760 張單光源影象,每個影象在 576 個檢視條件下看到的 10 個物件。

專案:資料集可用於人臉識別、分身列表對比等。