近期無監督或半監督行人重識別有什麼進展？

1樓：資訊門下迷妹

在很多人臉識別中也遇到這樣的問題。比如cuhk在lfw上很高的演算法，到現實中效果就降低了。很大程度上是因為訓練資料集的人種，明星臉造成的。

期待能找到重識別的 cross domain 方案啊。資料集上dukemtmc-reid都是外中國人，market cuhk都是華人多。

2樓：

稍稍安利一下我們在ICCV 2017上發表的乙個關於Unsupervised re-ID的工作。

Dynamic Label Graph Matching for Unsupervised Video Re-Identification。

我們將每個camera下的samples構建乙個graph，將每乙個person當成乙個node，然後cross-camera 之間的positive samples就可以通過graph matching來進行mining。採用graph matching乙個主要的考慮是基於graph matching可以很好的挖掘樣本之間的關係，做乙個global的optimization，這一點可以參見CVPR 16 Joint Probabilistic Matching Using m-Best Solutions 。如果是matched nodes就可以被當成positive，unmatched 的nodes就是negative。

通過estimated labels我們就可以學習到乙個更好的metric，也可以通過這個學習好的metric來propagate 到更多的camera中來mine positive。文中簡單採用了乙個label re-weighting來過濾一些false estimated labels。文章的code也在github上release了，感興趣的可以去試試。

我覺得可能有以下幾個改進點：

一些更先進的outlier removement 來替代label re-weighting應該可以大幅提公升最後的效果。

文中通過graph matching 去mine positive，依賴於兩個camera 下大部分sample都是匹配的假設，一些更robust graph matching 方法應該可以比較好的克服這個問題。如partial matching。

針對於video的情況，可以考慮一些更複雜的graph結構去更好的mining sample之間的關係，如multi-layer graph。

3樓：王劍邦

剛接觸Re-ID領域，查閱到這個問題，最近也在讀鄭良博士的這篇文章 1705.10444 Unsupervised Person Re-identification: Clustering and Fine-tuning。

但文中有一處，還是覺得有些confused。

公式(2)中vi是乙個取值為0/1的indicator，但文章中的寫法 λ ||v||，和後面的描述中提到取全0/全1的兩種極限情況。一方面感覺是類似於正則項，另一方面又感覺像是需要做乙個trade-off

但其實公式詳細推導和從(Fig.1 selection)，且文中也提到了，其實就是將λ作為乙個篩選閾值吧？

如果這樣來理解，雖然沒有漂亮的公式，是不是能簡化問題，同時也避免mislead呢

個人理解，輕拍

近期無監督或半監督行人重識別有什麼進展？

怎麼解釋無監督學習？

到底什麼才是無監督學習？

如何評價hinton組的最新半監督工作SimCLRv2？

其他用戶還看了：

近期無監督或半監督行人重識別有什麼進展？

怎麼解釋 無監督學習 ？

到底什麼才是無監督學習？

如何評價hinton組的最新半監督工作SimCLRv2？

其他用戶還看了：

怎麼解釋無監督學習？