Uczenie reprezentacji dla chmur punktów 3D

Adrian Zdobylak

212824@student.pwr.edu.pl
Problemy z przetwarzaniem punktów 3D: * brak kolejności pomiędzy punktami * siatki wokseli (trójwymiarowe piksele) nie są wydajne
Image source: https://www.mdpi.com/2072-4292/5/2/584/htm
Architektura sieci
Triplets
L = max(d(a, p) - d(a, n) + margin, 0)
* **easy triplets**: triplety które są już odseparowane d(a,p)+margin < d(a,n) * **hard triplets**: negatywny bliżej niż pozytywny d(a,n) < d(a,p) * **semi-hard triplets**: pozytywny jest bliżej niż negatywny, ale o niewystarczającą odległość (margin) d(a,p) < d(a,n) < d(a,p)+margin
### Metody wyboru tripletów * **batch all**: wszystkie możliwe triplety (i, j, k), uśrednianie straty na hard i semi-hard tripletach * **batch hard**: wybieramy najdalszy pozytywny d(a, p) i najbliższy negatywny d(a, n)
Eksperymenty
* 16 kategorii * train/test: 80%/20% * klasyfikacja na podstawie wyuczonej reprezentacji
| | epoka| k=1 | k=2 | k=3 | k=5 | |---|---|---|---|---|---| | AE| 71|98.26%|98.12% | 98.15% | 98.01% | | AE| 49|98.50%|98.08% | 98.15% | 97.98% | | T[0.5] | 37 | 97.87% | 97.73% | 97.80% | 97.56% | | T^2[0.5]| 17 | 98.19%|97.98%|97.87%|97.77%|

Kolejne kroki:

  • weryfikacja zbieżności dla uczenia triplet lossem
  • uczenie całego AE przy użyciu triplet loss
  • uczenie nie większym zbiorze

Źródła