近期無監督或半監督行人重識別有什麼進展?

時間 2021-05-05 18:51:41

1樓:資訊門下迷妹

在很多人臉識別中也遇到這樣的問題。比如cuhk在lfw上很高的演算法,到現實中效果就降低了。很大程度上是因為訓練資料集的人種,明星臉造成的。

期待能找到重識別的 cross domain 方案啊。資料集上dukemtmc-reid都是外中國人,market cuhk都是華人多。

2樓:

稍稍安利一下我們在ICCV 2017上發表的乙個關於Unsupervised re-ID的工作。

Dynamic Label Graph Matching for Unsupervised Video Re-Identification。

我們將每個camera下的samples構建乙個graph,將每乙個person當成乙個node,然後cross-camera 之間的positive samples就可以通過graph matching來進行mining。採用graph matching乙個主要的考慮是基於graph matching可以很好的挖掘樣本之間的關係,做乙個global的optimization,這一點可以參見CVPR 16 Joint Probabilistic Matching Using m-Best Solutions 。如果是matched nodes就可以被當成positive,unmatched 的nodes就是negative。

通過estimated labels我們就可以學習到乙個更好的metric,也可以通過這個學習好的metric來propagate 到更多的camera中來mine positive。文中簡單採用了乙個label re-weighting來過濾一些false estimated labels。文章的code也在github上release了,感興趣的可以去試試。

我覺得可能有以下幾個改進點:

一些更先進的outlier removement 來替代label re-weighting應該可以大幅提公升最後的效果。

文中通過graph matching 去mine positive,依賴於兩個camera 下大部分sample都是匹配的假設,一些更robust graph matching 方法應該可以比較好的克服這個問題。如partial matching。

針對於video的情況,可以考慮一些更複雜的graph結構去更好的mining sample之間的關係,如multi-layer graph。

3樓:王劍邦

剛接觸Re-ID領域,查閱到這個問題,最近也在讀鄭良博士的這篇文章 1705.10444 Unsupervised Person Re-identification: Clustering and Fine-tuning。

但文中有一處,還是覺得有些confused。

公式(2)中vi是乙個取值為0/1的indicator,但文章中的寫法 λ ||v||,和後面的描述中提到取全0/全1的兩種極限情況。一方面感覺是類似於正則項,另一方面又感覺像是需要做乙個trade-off

但其實公式詳細推導和從(Fig.1 selection),且文中也提到了,其實就是將λ作為乙個篩選閾值吧?

如果這樣來理解,雖然沒有漂亮的公式,是不是能簡化問題,同時也避免mislead呢

個人理解,輕拍

怎麼解釋 無監督學習 ?

KnowingAI知智 定義 無監督學習,是指機器通過學習沒有標籤的資料,根據特徵將它們分為若干類別的過程。如何理解無監督學習相對於監督學習,無監督學習使用的是沒有標籤的資料。機器會主動學習資料的特徵,並將它們分為若干類別,相當於形成 未知的標籤 比如我們向機器輸入一些未經標註的櫻桃資料後,機器會主...

到底什麼才是無監督學習?

Lanzhe Guo 在無監督學習過程中,訓練樣本的標記資訊是未知的,無監督學習可以通過對無標記訓練樣本的學習來揭示資料的內在性質和規律,為進一步的資料分析提供基礎。問題中提到的新聞分組,就是無監督學習中應用最多的 聚類 clustering 聚類試圖將資料集中的樣本劃分為若干個通常是不相交的子集。...

如何評價hinton組的最新半監督工作SimCLRv2?

借樓問個問題 Sec 2,Self supervised pretraining with SimCLRv2 裡面的第2點,他們把 projection head 增加了一層,然後說 finetune from the 1st layer of projection head.那這樣跟把 backb...