O Algoritimo k vizinhos mais similares(kNN, do inglês k nearest neighbors) apesar de simples, tem se mostrado um dos métodos mais eficazes já propostos para análise de dados. Ele tem a caracteristica de um algoritimo de aprendizado competivo, pois utiliza internamente a competição entre os elementos do modelo. O que define a instancia vencedora é a sua similaridade objetiva. Outra caracteristica é também de aprendizado preguiçoso baseado em instancia, ou seja todos os dados que ele pegar será armazenado em um banco de dados para ser usado para comparação mais tarde, isso faz com o algoritmo fique muito pesado para rodar.
Algoritimo baseado em instancia se utiliza de dados(nesse exemplo utilizado com linha) para tomar decisões preditivas.
Portanto, o algoritimo é poderoso porque não assume nada sobre os dados, a não ser que uma medida de distância possa ser calculada consistentemente entre duas instâncias. É chamado de não-paramétrico ou não-linear, pois não assume uma forma funcional.
Esse algoritimo tem aplicação em diversas areas de predição, podendo ser por exemplo utilizado em sistemas de recomendação.