Tabla de contenido:
Definición - ¿Qué significa K-Means Clustering?
La agrupación de K-means es un algoritmo de aprendizaje simple sin supervisión que se utiliza para resolver problemas de agrupación. Sigue un procedimiento simple de clasificar un conjunto de datos dado en una serie de grupos, definidos por la letra "k", que se fija de antemano. Luego, los grupos se posicionan como puntos y todas las observaciones o puntos de datos se asocian con el grupo más cercano, se calculan, ajustan y luego el proceso comienza nuevamente usando los nuevos ajustes hasta que se alcanza el resultado deseado.
La agrupación de K-means tiene usos en motores de búsqueda, segmentación de mercado, estadísticas e incluso astronomía.
Techopedia explica el agrupamiento de K-medias
La agrupación K-means es un método utilizado para el análisis de agrupación, especialmente en minería de datos y estadísticas. Su objetivo es dividir un conjunto de observaciones en varios grupos (k), lo que da como resultado la división de los datos en celdas de Voronoi. Se puede considerar un método para descubrir a qué grupo pertenece realmente un determinado objeto.
Se utiliza principalmente en estadística y se puede aplicar a casi cualquier rama de estudio. Por ejemplo, en marketing, se puede usar para agrupar diferentes grupos demográficos de personas en grupos simples que facilitan la orientación de los especialistas en marketing. Los astrónomos lo usan para examinar grandes cantidades de datos astronómicos; Como no pueden analizar cada objeto uno por uno, necesitan una forma de encontrar estadísticamente puntos de interés para la observación y la investigación.
El algoritmo:
- Los puntos K se colocan en el espacio de datos del objeto que representa el grupo inicial de centroides.
- Cada objeto o punto de datos se asigna a la k más cercana.
- Después de asignar todos los objetos, se recalculan las posiciones de los k centroides.
- Los pasos 2 y 3 se repiten hasta que las posiciones de los centroides ya no se mueven.
