Jaka jest różnica między wektorami własnymi macierzy powinowactwa a grafowymi wektorami własnymi Laplaca w kontekście grupowania widm?

On 31 stycznia, 2021 by admin

W klastrowaniu widmowym standardową praktyką jest rozwiązywanie problemu wektora własnego

$$ L v = \ lambda v $$

gdzie $ L $ to wykres laplaciański, $ v $ to wektor własny powiązany z wartością własną $ \ lambda $.

Moje pytanie: po co zawracać sobie głowę wykresem laplackim? Nie mogłem po prostu rozwiąż problem wektora własnego dla samego wykresu (macierzy powinowactwa), tak, jak zrobił to facet na tym filmie ?

PS: Zrobiłem to samo pytanie w CrossValidated, ale myślę, że jest to bardziej odpowiedni kanał. Wybacz, jeśli się mylę.

Komentarze

Link do filmu jest uszkodzony 🙁

Odpowiedź

Koncepcja jest taka sama, ale jesteś zdezorientowany typem danych. Grupowanie widmowe jako Ng et al. wyjaśnienie dotyczy grupowania standardowych danych, podczas gdy macierz Laplaciana jest macierzą wyprowadzoną z wykresu używaną w teorii grafów algebraicznych.

Chodzi o to, że za każdym razem, gdy kodujesz podobieństwo swoich obiektów w macierz ta może być użyta do grupowania widmowego.

Jeśli masz standardowe dane, np. macierz próbki-cechy, możesz znaleźć bliskość lub powinowactwo lub jakkolwiek to nazwać macierzą i zastosować spektralne grupowanie.

Jeśli masz wykres, to powinowactwo byłoby czymś w rodzaju macierzy sąsiedztwa, macierzy odległości lub macierzy Laplacialna, a rozwiązanie funkcji własnej dla takiej macierzy daje odpowiedni wynik.

Punkt dotyczący używania Laplacian zamiast a djacency polega na utrzymaniu tak zwanej macierzy powinowactwa dodatniej pół-określonej (a znormalizowana macierz Laplacian jest lepszym wyborem, ponieważ daje znormalizowane wartości własne między 0 a 2 i znacznie lepiej ujawnia strukturę wykresu).

Krótko mówiąc, tak długo, jak masz macierz zawierającą powinowactwo danych, można ogólnie używać grupowania widmowego. Różnica tkwi w szczegółach (np. Własność znormalizowanego Laplacian, o którym właśnie wspomniałem)

Komentarze

Tak, myślę, że ' jest trochę zdezorientowany. ' nadal nie jest dla mnie jasne. Jeśli mam dane standardowe (bez powiązania z powinowactwem), mogę uczynić z nich macierz powinowactwa A, biorąc odległość parami między próbkami danych. Teraz, jeśli widzę A jako wykres, mogę wziąć laplacian i znaleźć wektory własne i otrzymać rozwiązanie; jeśli ' nie widzę A jako wykresu, mógłbym po prostu znaleźć macierz wektorów własnych (PCA) i uzyskać rozwiązanie. Jaka ' jest różnica?
Ponownie przeczytałem Twoje pytanie. Odpowiedzią są właściwości (np. Ta, o której wspomniałem w mojej odpowiedzi) macierz Laplaciana zapewniająca lepszy rozkład. Jednak absolutnie możesz wydzielić funkcję własną dla dowolnej macierzy związanej z podobieństwem i uzyskać wyniki, które różnią się tylko szczegółami. Na przykład o PCA, o którym wspomniałeś: PCA przyjmuje macierz kowariancji, więc wychwytuje tam, gdzie wariancja jest wysoka, ale ogólnie koncepcja podąża w tym samym kierunku, co inne techniki rozkładu widmowego. ' sprawdzę odpowiedź, gdy zobaczę jakieś " sobotni wieczór " zdania; )

Jaka jest różnica między wektorami własnymi macierzy powinowactwa a grafowymi wektorami własnymi Laplaca w kontekście grupowania widm?

Komentarze

Odpowiedź

Komentarze

Written by admin

Dodaj komentarz Anuluj pisanie odpowiedzi

Najnowsze wpisy

Archiwa