Artificial Intelligence
KNN アルゴリズムを理解するためのクイック ガイド

ビジネスの世界でも積極的に導入されている データサイエンス、最も人気のある分野のXNUMXつとなっています。 K 最近傍アルゴリズムとは何か、またその仕組みについて説明します。
KNNアルゴリズムとは何ですか?
K 最近傍アルゴリズム (または KNN) は、そのシンプルさから最もよく使用される学習アルゴリズムの XNUMX つです。 KNN または K 最近傍アルゴリズムは、互いに近くにあるすべてのデータ ポイントが同じクラスに属するという原理に基づいて機能する教師あり学習アルゴリズムです。 ここでの基本的な前提は、互いに近いものは互いに似ているということです。 解釈が容易で計算時間が短いため、主に KNN アルゴリズムが使用されます。
KNN は、機械学習の分類および回帰問題に広く使用されています。 KNN の例としては、電子商取引ポータルが同様の製品を推奨するために使用するアルゴリズムが挙げられます。
例を見てみましょう:
与えられた画像には XNUMX つのクラスのデータがあります。 正方形を表すクラス A と三角形を表すクラス B。
問題は、KNN アルゴリズムを使用して、新しい入力データ ポイントを XNUMX つのクラスのいずれかに割り当てることです。
最初のステップは、最近傍数を表す「K」の値を定義することです。
「k」の値が 6 の場合、そのデータ ポイントに最も近い 6 つの近傍を検索します。「k」の値が 5 の場合、そのデータ ポイントに最も近い 5 つの近傍を検索します。
「K」= 4 について考えてみましょう。これは、アルゴリズムがデータ ポイントに最も近い XNUMX つの近傍を考慮することを意味します。
ここで、'K' = 4 では、4 つの三角形と XNUMX つの正方形が最近傍として見られます。 したがって、「K」 = XNUMX に基づく新しいデータ ポイントはクラス A に割り当てられます。
KNN をどこで使用するか?
KNN は、分類問題と回帰予測問題の両方で使用されます。 ただし、工業目的に適用される場合は、技術の有用性を決定する際に評価されるすべてのパラメータにわたって公平であるため、ほとんどの場合、分類に使用されます。
- 予測力
- 計算時間
- 出力の解釈が容易
それは日常の問題にどのように活用されますか?
KNN はその単純さにもかかわらず、他の強力な分類器よりもはるかに優れた機能を備えており、経済予測、データ圧縮、ビデオ認識、画像認識、手書き検出、音声認識などの場所で使用されています。
KNN アルゴリズムの主な用途
KNN アルゴリズムは、銀行システムで使用され、その人が債務不履行者と同様の特徴を持っているかどうかを予測することで、ローンの承認に適しているかどうかを予測します。 KNN は、同様の特性を持つ個人と比較することで、個人の信用スコアを計算するのにも役立ちます。
KNN を使用している企業
Amazon や Netflix などの電子商取引およびエンターテイメント企業のほとんどは、購入する製品や視聴する映画や番組を推奨するときに KNN を使用しています。
彼らはどのようにしてこのような推奨を行うのでしょうか? これらの企業は、以前に購入した製品や Web サイトで視聴した映画などのユーザーの行動に関するデータを収集し、KNN を適用します。
企業はあなたの利用可能な顧客データを入力し、それを同様の製品を購入したり、同様の映画を視聴した他の顧客と比較します。
アルゴリズムがそのデータ ポイントを分類する方法に応じて、製品や映画が推奨されます。
KNNのメリットとデメリット
KNNのメリット
- 高速計算
- シンプルなアルゴリズム – 解釈する
- 多用途 – 分類と回帰に役立ちます
- 高精度
- データに関する仮定はありません。追加の仮定を行ったり、モデルを構築したりする必要はありません。
KNNのデメリット
- 精度はデータの品質に依存します
- データが大きいと予測が遅くなる
- 大規模なデータセットには関係ありません
- すべてのトレーニング データを保存する必要があるため、大量のメモリが必要になります
- すべてのトレーニングを保存するため、計算コストが高くなる可能性があります
このブログでは、分類に広く使用されている K-NN アルゴリズムについて説明してきました。 KNN の背後にある基本的なアプローチ、KNN の仕組み、およびその利点と欠点について説明しました。
KNN アルゴリズムは最も単純なアルゴリズムの XNUMX つであり、非常に攻撃的な結果が得られます。 KNN アルゴリズムは、分類問題と回帰問題の両方に使用できます。