agglomeratív klaszterezés

Kapcsolódó fogalmak: 
információkeresés
Kapcsolódó fogalmak: 
információgyűjtés
Kapcsolódó fogalmak: 
információkinyerés
Kapcsolódó fogalmak: 
klaszterezés
Kapcsolódó fogalmak: 
klasztercsomópont
Rövid szöveges bemutatás: 
Ez az algoritmus tulajdonképpen dokumentumok megkülönböztetéséről vagy éppen hasonlóságáról dönt. Tegyük fel, hogy van n db dokumentumunk. Mindegyik dokumentumot egy egyednek, egy klaszternek tekintjük. Az algoritmus ezekből a dokumentumokból egy fát épít, melynek levelei ez az n db dokumentum. A fa nyeshető, hogy kevesebb dokumentumot kapjunk. Ezután elkezdjük összevonni a fa leveleit, valamilyen távolságmérték alapján, amit a dokumentumok között definiálunk. Ezt többféleképpen megtehetjük, például, ha a dokumentum szógyakoriságát vektorként értelmezzük, és két dokumentum ezen vektorának távolságát vesszük figyelembe. A folyamat addig tart, amíg csak egy klaszter marad, időigénye O(n^2).