Trí tuệ nhân tạo
Hướng dẫn nhanh để hiểu thuật toán KNN

Với thế giới kinh doanh tích cực áp dụng Khoa học dữ liệu, nó đã trở thành một trong những lĩnh vực được tìm kiếm nhiều nhất. Chúng tôi giải thích thuật toán K-hàng xóm gần nhất là gì và nó hoạt động như thế nào.
Thuật toán KNN là gì?
K-Thuật toán hàng xóm gần nhất (hoặc KNN) là một trong những thuật toán học được sử dụng nhiều nhất do tính đơn giản của nó. Thuật toán KNN hoặc K-láng giềng gần nhất là thuật toán học có giám sát hoạt động theo nguyên tắc mọi điểm dữ liệu nằm gần nhau đều thuộc cùng một lớp. Giả định cơ bản ở đây là những thứ ở gần nhau thì giống nhau. Hầu hết, Thuật toán KNN được sử dụng vì dễ giải thích và thời gian tính toán thấp.
KNN được sử dụng rộng rãi cho các vấn đề phân loại và hồi quy trong học máy. Một vài ví dụ về KNN là các thuật toán được các cổng thương mại điện tử sử dụng để giới thiệu các sản phẩm tương tự.
Hãy cùng xem xét một ví dụ:
Trong hình ảnh đã cho, chúng ta có hai lớp dữ liệu. Lớp A đại diện cho hình vuông và lớp B đại diện cho hình tam giác.
Bài toán gán một điểm dữ liệu đầu vào mới cho một trong hai lớp với việc sử dụng thuật toán KNN
Bước đầu tiên là xác định giá trị của 'K', viết tắt của số Hàng xóm gần nhất.
Nếu giá trị của “k” là 6, nó sẽ tìm 6 Neighbor gần nhất với điểm dữ liệu đó, Nếu giá trị của “k” là 5, nó sẽ tìm 5 Neighbor gần nhất với điểm dữ liệu đó.
Chúng ta hãy xem xét 'K' = 4, điều này có nghĩa là thuật toán sẽ xem xét bốn người hàng xóm gần nhất với điểm dữ liệu.
Bây giờ, tại 'K' = 4, một hình tam giác và hai hình vuông có thể được coi là những hàng xóm gần nhất. Vì vậy, điểm dữ liệu mới dựa trên 'K' = 4, sẽ được gán cho Loại A.
Sử dụng KNN ở đâu?
KNN được sử dụng trong cả bài toán dự đoán phân loại và hồi quy. Tuy nhiên, khi nó được áp dụng cho các mục đích công nghiệp, nó chủ yếu được sử dụng trong phân loại vì nó công bằng trên tất cả các tham số được đánh giá khi xác định khả năng sử dụng của một kỹ thuật.
- sức mạnh dự đoán
- Thời gian tính toán
- Dễ dàng giải thích đầu ra
Làm thế nào nó được sử dụng trong các vấn đề hàng ngày?
Mặc dù đơn giản, KNN hoạt động tốt hơn nhiều so với các trình phân loại mạnh mẽ khác và được sử dụng ở những nơi, chẳng hạn như dự báo kinh tế và nén dữ liệu, Nhận dạng video, Nhận dạng hình ảnh, Phát hiện chữ viết tay và Nhận dạng giọng nói.
Một số ứng dụng chính của thuật toán KNN
Thuật toán KNN được sử dụng trong hệ thống ngân hàng để dự đoán xem một người có phù hợp để được phê duyệt khoản vay hay không bằng cách dự đoán xem người đó có những đặc điểm tương tự với người vỡ nợ hay không. KNN cũng giúp tính toán điểm tín dụng của các cá nhân bằng cách so sánh nó với những người có đặc điểm tương tự.
Các công ty sử dụng KNN
Hầu hết các công ty thương mại điện tử và giải trí như Amazon hay Netflix đều sử dụng KNN khi đề xuất sản phẩm nên mua hoặc phim/chương trình nên xem.
Làm sao họ lại đưa ra những khuyến nghị này? Các công ty này thu thập dữ liệu về hành vi của người dùng, chẳng hạn như các sản phẩm bạn đã mua trước đây hoặc các bộ phim bạn đã xem trên trang web của họ và áp dụng KNN.
Các công ty sẽ nhập dữ liệu khách hàng có sẵn của bạn và so sánh dữ liệu đó với những khách hàng khác đã mua sản phẩm tương tự hoặc đã xem những bộ phim tương tự.
Các sản phẩm và phim sau đó sẽ được đề xuất cho bạn, tùy thuộc vào cách thuật toán phân loại điểm dữ liệu đó.
Ưu điểm và nhược điểm của KNN
Ưu điểm của KNN
- Tính toán nhanh
- Thuật toán đơn giản – để diễn giải
- Đa năng – hữu ích cho việc phân loại và hồi quy
- Độ chính xác cao
- Không có giả định về dữ liệu – không cần đưa ra giả định bổ sung hoặc xây dựng mô hình.
Nhược điểm của KNN
- Độ chính xác phụ thuộc vào chất lượng của dữ liệu
- Dự đoán trở nên chậm với dữ liệu lớn
- Không phù hợp với tập dữ liệu lớn
- Cần lưu trữ tất cả dữ liệu đào tạo, do đó yêu cầu bộ nhớ cao
- Nó có thể tốn kém về mặt tính toán vì nó lưu trữ tất cả các khóa đào tạo
Trong blog này, chúng tôi đã cố gắng giải thích thuật toán K-NN được sử dụng rộng rãi để phân loại. Chúng tôi đã thảo luận về cách tiếp cận cơ bản đằng sau KNN, cách thức hoạt động cũng như những ưu điểm và nhược điểm của nó.
Thuật toán KNN là một trong những thuật toán đơn giản nhất và có thể cho kết quả rất tích cực. Thuật toán KNN có thể được sử dụng cho cả bài toán phân loại và hồi quy.