了解 KNN 算法的快速指南

发布时间 2021 年 2 月 1 日

更新 2022 年 12 月 9 日

帕拉克·艾龙

随着商业世界积极采用数据科学，它已成为最受追捧的领域之一。我们解释什么是 K 最近邻算法及其工作原理。

什么是KNN算法？

K-最近邻算法（或 KNN）由于其简单性而成为最常用的学习算法之一。 KNN 或 K 最近邻算法是一种监督学习算法，其工作原理是每个彼此接近的数据点都属于同一类。这里的基本假设是，彼此靠近的事物彼此相似。大多数情况下，使用 KNN 算法是因为它易于解释且计算时间短。

KNN 广泛用于机器学习中的分类和回归问题。 KNN 的一些例子是电子商务门户网站用来推荐类似产品的算法。

在给定的图像中，我们有两类数据。 A类代表正方形，B类代表三角形。

问题是使用 KNN 算法将新的输入数据点分配给两个类之一

第一步是定义“K”的值，它代表最近邻居的数量。

如果“k”的值为6，它将查找该数据点的6个最近邻，如果“k”的值为5，它将查找该数据点的5个最近邻。

假设“K”= 4，这意味着算法将考虑与数据点最接近的四个邻居。

现在，当 'K' = 4 时，一个三角形和两个正方形可以被视为最近的邻居。因此，基于“K”= 4 的新数据点将被分配给 A 类。

KNN 用于分类和回归预测问题。然而，当它应用于工业目的时，它主要用于分类，因为它在确定技术可用性时评估的所有参数都是公平的。

尽管 KNN 很简单，但其工作效果比其他强大的分类器要好得多，并且可用于经济预测、数据压缩、视频识别、图像识别、手写检测和语音识别等领域。

KNN 算法在银行系统中使用，通过预测一个人是否具有与违约者相似的特征来预测一个人是否适合贷款审批。 KNN 还通过与具有相似特征的人进行比较来帮助计算个人的信用评分。

大多数电子商务和娱乐公司（例如 Amazon 或 Netflix）在推荐要购买的产品或要观看的电影/节目时都使用 KNN。

他们是如何做出这些推荐的？这些公司会收集用户行为数据，例如你之前购买过的产品或在其网站上看过的电影，然后应用 KNN。

这些公司将输入您的可用客户数据，并将其与购买类似产品或观看类似电影的其他客户进行比较。

然后，将根据算法对该数据点进行分类的方式向您推荐产品和电影。

在这篇博客中，我们试图解释广泛用于分类的 K-NN 算法。我们讨论了 KNN 背后的基本方法、它的工作原理以及它的优点和缺点。

KNN 算法是最简单的算法之一，可以给出高度激进的结果。 KNN 算法可用于分类和回归问题。