人工智能
了解 KNN 算法的快速指南

随着商业世界积极采用 数据科学,它已成为最受追捧的领域之一。 我们解释什么是 K 最近邻算法及其工作原理。
什么是KNN算法?
K-最近邻算法 (或 KNN)由于其简单性而成为最常用的学习算法之一。 KNN 或 K 最近邻算法是一种监督学习算法,其工作原理是每个彼此接近的数据点都属于同一类。 这里的基本假设是,彼此靠近的事物彼此相似。 大多数情况下,使用 KNN 算法是因为它易于解释且计算时间短。
KNN 广泛用于机器学习中的分类和回归问题。 KNN 的一些例子是电子商务门户网站用来推荐类似产品的算法。
让我们回顾一个例子:
在给定的图像中,我们有两类数据。 A类代表正方形,B类代表三角形。
问题是使用 KNN 算法将新的输入数据点分配给两个类之一
第一步是定义“K”的值,它代表最近邻居的数量。

如果“k”的值为6,它将查找该数据点的6个最近邻,如果“k”的值为5,它将查找该数据点的5个最近邻。
假设“K”= 4,这意味着算法将考虑与数据点最接近的四个邻居。
现在,当 'K' = 4 时,一个三角形和两个正方形可以被视为最近的邻居。 因此,基于“K”= 4 的新数据点将被分配给 A 类。

在哪里使用 KNN?
KNN 用于分类和回归预测问题。 然而,当它应用于工业目的时,它主要用于分类,因为它在确定技术可用性时评估的所有参数都是公平的。
- 预测能力
- 计算时间
- 易于解释输出
如何运用它来解决日常问题?
尽管 KNN 很简单,但其工作效果比其他强大的分类器要好得多,并且可用于经济预测、数据压缩、视频识别、图像识别、手写检测和语音识别等领域。
KNN算法的一些主要用途
KNN 算法在银行系统中使用,通过预测一个人是否具有与违约者相似的特征来预测一个人是否适合贷款审批。 KNN 还通过与具有相似特征的人进行比较来帮助计算个人的信用评分。
使用 KNN 的公司
大多数电子商务和娱乐公司(例如 Amazon 或 Netflix)在推荐要购买的产品或要观看的电影/节目时都使用 KNN。
他们是如何做出这些推荐的?这些公司会收集用户行为数据,例如你之前购买过的产品或在其网站上看过的电影,然后应用 KNN。
这些公司将输入您的可用客户数据,并将其与购买类似产品或观看类似电影的其他客户进行比较。
然后,将根据算法对该数据点进行分类的方式向您推荐产品和电影。
KNN的优点和缺点
KNN的优点
- 快速计算
- 简单的算法——解释
- 多功能——对于分类和回归有用
- 精度高
- 无需对数据做出任何假设——无需做出额外假设或构建模型。
KNN的缺点
- 准确性取决于数据的质量
- 数据量大时预测会变慢
- 与大数据集无关
- 需要存储所有的训练数据,因此需要较高的内存
- 由于它存储所有训练,因此计算成本可能很高
在这篇博客中,我们试图解释广泛用于分类的 K-NN 算法。 我们讨论了 KNN 背后的基本方法、它的工作原理以及它的优点和缺点。
KNN 算法是最简单的算法之一,可以给出高度激进的结果。 KNN 算法可用于分类和回归问题。












