Jaka jest różnica między wektorami własnymi macierzy powinowactwa a grafowymi wektorami własnymi Laplaca w kontekście grupowania widm?
On 31 stycznia, 2021 by adminW klastrowaniu widmowym standardową praktyką jest rozwiązywanie problemu wektora własnego
$$ L v = \ lambda v $$
gdzie $ L $ to wykres laplaciański, $ v $ to wektor własny powiązany z wartością własną $ \ lambda $.
Moje pytanie: po co zawracać sobie głowę wykresem laplackim? Nie mogłem po prostu rozwiąż problem wektora własnego dla samego wykresu (macierzy powinowactwa), tak, jak zrobił to facet na tym filmie ?
PS: Zrobiłem to samo pytanie w CrossValidated, ale myślę, że jest to bardziej odpowiedni kanał. Wybacz, jeśli się mylę.
Komentarze
- Link do filmu jest uszkodzony 🙁
Odpowiedź
Koncepcja jest taka sama, ale jesteś zdezorientowany typem danych. Grupowanie widmowe jako Ng et al. wyjaśnienie dotyczy grupowania standardowych danych, podczas gdy macierz Laplaciana jest macierzą wyprowadzoną z wykresu używaną w teorii grafów algebraicznych.
Chodzi o to, że za każdym razem, gdy kodujesz podobieństwo swoich obiektów w macierz ta może być użyta do grupowania widmowego.
Jeśli masz standardowe dane, np. macierz próbki-cechy, możesz znaleźć bliskość lub powinowactwo lub jakkolwiek to nazwać macierzą i zastosować spektralne grupowanie.
Jeśli masz wykres, to powinowactwo byłoby czymś w rodzaju macierzy sąsiedztwa, macierzy odległości lub macierzy Laplacialna, a rozwiązanie funkcji własnej dla takiej macierzy daje odpowiedni wynik.
Punkt dotyczący używania Laplacian zamiast a djacency polega na utrzymaniu tak zwanej macierzy powinowactwa dodatniej pół-określonej (a znormalizowana macierz Laplacian jest lepszym wyborem, ponieważ daje znormalizowane wartości własne między 0 a 2 i znacznie lepiej ujawnia strukturę wykresu).
Krótko mówiąc, tak długo, jak masz macierz zawierającą powinowactwo danych, można ogólnie używać grupowania widmowego. Różnica tkwi w szczegółach (np. Własność znormalizowanego Laplacian, o którym właśnie wspomniałem)
Komentarze
- Tak, myślę, że ' jest trochę zdezorientowany. ' nadal nie jest dla mnie jasne. Jeśli mam dane standardowe (bez powiązania z powinowactwem), mogę uczynić z nich macierz powinowactwa A, biorąc odległość parami między próbkami danych. Teraz, jeśli widzę A jako wykres, mogę wziąć laplacian i znaleźć wektory własne i otrzymać rozwiązanie; jeśli ' nie widzę A jako wykresu, mógłbym po prostu znaleźć macierz wektorów własnych (PCA) i uzyskać rozwiązanie. Jaka ' jest różnica?
- Ponownie przeczytałem Twoje pytanie. Odpowiedzią są właściwości (np. Ta, o której wspomniałem w mojej odpowiedzi) macierz Laplaciana zapewniająca lepszy rozkład. Jednak absolutnie możesz wydzielić funkcję własną dla dowolnej macierzy związanej z podobieństwem i uzyskać wyniki, które różnią się tylko szczegółami. Na przykład o PCA, o którym wspomniałeś: PCA przyjmuje macierz kowariancji, więc wychwytuje tam, gdzie wariancja jest wysoka, ale ogólnie koncepcja podąża w tym samym kierunku, co inne techniki rozkładu widmowego. ' sprawdzę odpowiedź, gdy zobaczę jakieś " sobotni wieczór " zdania; )
Dodaj komentarz