Connect with us

Những Mạng Nơ-ron Là Gì?

AI 101

Những Mạng Nơ-ron Là Gì?

mm

Những Mạng Nơ-ron Nhân Tạo (ANNs) Là Gì?

Nhiều tiến bộ lớn nhất trong lĩnh vực trí tuệ nhân tạo được đẩy mạnh bởi mạng nơ-ron nhân tạo. Mạng Nơ-ron Nhân Tạo (ANNs) là sự kết nối của các hàm toán học được kết hợp với nhau theo định dạng được lấy cảm hứng từ mạng nơ-ron trong não bộ con người. Những ANN này có khả năng trích xuất các mẫu phức tạp từ dữ liệu, áp dụng các mẫu này vào dữ liệu chưa được xem để phân loại / nhận dạng dữ liệu. Theo cách này, máy “học”. Đó là một cái nhìn tổng quan nhanh về mạng nơ-ron, nhưng hãy cùng xem xét kỹ hơn về mạng nơ-ron để hiểu rõ hơn về chúng và cách chúng hoạt động.

Perceptron Đa Lớp Giải Thích

Trước khi chúng ta xem xét các mạng nơ-ron phức tạp hơn, chúng ta sẽ dành một chút thời gian để xem xét một phiên bản đơn giản của ANN, một Perceptron Đa Lớp (MLP).

Hãy tưởng tượng một dây chuyền sản xuất tại một nhà máy. Trên dây chuyền sản xuất này, một công nhân nhận một vật phẩm, thực hiện một số điều chỉnh và sau đó chuyển nó sang công nhân tiếp theo trong dây chuyền, người thực hiện điều tương tự. Quá trình này tiếp tục cho đến khi công nhân cuối cùng trong dây chuyền hoàn thiện vật phẩm và đặt nó lên một băng chuyền sẽ đưa nó ra khỏi nhà máy. Trong ẩn dụ này, có nhiều “lớp” trong dây chuyền sản xuất, và sản phẩm di chuyển giữa các lớp khi chúng di chuyển từ công nhân này sang công nhân khác. Dây chuyền sản xuất cũng có một điểm vào và một điểm ra.

Một Perceptron Đa Lớp có thể được coi là một dây chuyền sản xuất rất đơn giản, bao gồm ba lớp tổng cộng: một lớp đầu vào, một lớp ẩn và một lớp đầu ra. Lớp đầu vào là nơi dữ liệu được đưa vào MLP, và trong lớp ẩn, một số “công nhân” xử lý dữ liệu trước khi chuyển nó sang lớp đầu ra, cung cấp sản phẩm cho thế giới bên ngoài. Trong trường hợp của MLP, những công nhân này được gọi là “nơ-ron” (hoặc đôi khi là nút) và khi chúng xử lý dữ liệu, chúng sẽ thay đổi dữ liệu thông qua một loạt các hàm toán học.

Trong mạng, có các cấu trúc kết nối nút này với nút khác được gọi là “trọng số“. Trọng số là một giả định về cách các điểm dữ liệu liên quan khi chúng di chuyển qua mạng. Để nói một cách khác, trọng số phản ánh mức độ ảnh hưởng mà một nơ-ron có đối với một nơ-ron khác. Trọng số đi qua một “hàm kích hoạt” khi chúng rời khỏi nút hiện tại, đây là một loại hàm toán học biến đổi dữ liệu. Chúng biến đổi dữ liệu tuyến tính thành các biểu diễn phi tuyến, cho phép mạng phân tích các mẫu phức tạp.

Sự tương đồng với não bộ con người được ngụ ý bởi “mạng nơ-ron nhân tạo” xuất phát từ thực tế rằng các nơ-ron tạo nên não bộ con người được kết nối với nhau theo cách tương tự như các nút trong một ANN được liên kết.

Mặc dù các perceptron đa lớp đã tồn tại từ những năm 1940, nhưng có một số hạn chế đã ngăn cản chúng trở nên đặc biệt hữu ích. Tuy nhiên, trong suốt hai thập kỷ qua, một kỹ thuật gọi là “sự lan truyền ngược” đã được tạo ra, cho phép mạng điều chỉnh trọng số của các nơ-ron và do đó học hỏi hiệu quả hơn. Sự lan truyền ngược thay đổi trọng số trong mạng nơ-ron, cho phép mạng bắt được các mẫu thực sự trong dữ liệu.

Mạng Nơ-ron Sâu

Mạng nơ-ron sâu lấy dạng cơ bản của MLP và làm cho nó lớn hơn bằng cách thêm nhiều lớp ẩn ở giữa mô hình. Vì vậy, thay vì có một lớp đầu vào, một lớp ẩn và một lớp đầu ra, có nhiều lớp ẩn ở giữa và đầu ra của một lớp ẩn trở thành đầu vào cho lớp ẩn tiếp theo cho đến khi dữ liệu đã đi qua toàn bộ mạng và được trả lại.

Các lớp ẩn nhiều của mạng nơ-ron sâu có thể giải thích các mẫu phức tạp hơn so với perceptron đa lớp truyền thống. Các lớp khác nhau của mạng nơ-ron sâu học các mẫu của các phần khác nhau của dữ liệu. Ví dụ, nếu dữ liệu đầu vào bao gồm hình ảnh, phần đầu tiên của mạng có thể giải thích độ sáng hoặc tối của pixel trong khi các lớp sau sẽ chọn ra các hình dạng và cạnh mà có thể được sử dụng để nhận dạng các vật thể trong hình ảnh.

Các Loại Mạng Nơ-ron Khác Nhau

Có nhiều loại mạng nơ-ron, và mỗi loại mạng nơ-ron khác nhau có ưu điểm và nhược điểm riêng (và do đó có các trường hợp sử dụng riêng). Loại mạng nơ-ron sâu được mô tả ở trên là loại mạng nơ-ron phổ biến nhất và thường được gọi là mạng nơ-ron馈 tiến.

Một biến thể của mạng nơ-ron là Mạng Nơ-ron Recurrent (RNN). Trong trường hợp của Mạng Nơ-ron Recurrent, các cơ chế lặp lại được sử dụng để giữ thông tin từ các trạng thái phân tích trước, có nghĩa là chúng có thể giải thích dữ liệu nơi thứ tự quan trọng. RNN hữu ích trong việc suy dẫn mẫu từ dữ liệu tuần tự / thời gian. Mạng Nơ-ron Recurrent có thể là unidirectional hoặc bidirectional. Trong trường hợp của một mạng nơ-ron bidirectional, mạng có thể lấy thông tin từ sau trong chuỗi cũng như các phần trước của chuỗi. Vì mạng nơ-ron bidirectional xem xét nhiều thông tin hơn, nó có thể vẽ ra các mẫu đúng từ dữ liệu.

Mạng Nơ-ron Tích Chập (CNN) là một loại mạng nơ-ron đặc biệt có khả năng giải thích các mẫu được tìm thấy trong hình ảnh. Một CNN hoạt động bằng cách truyền một bộ lọc qua các pixel của hình ảnh và đạt được một biểu diễn số của các pixel trong hình ảnh, mà nó có thể phân tích để tìm kiếm mẫu. Một CNN được cấu trúc để các lớp tích chập mà kéo các pixel ra khỏi hình ảnh đến trước, và sau đó là các lớp馳 tiến密 kết nối thực sự học cách nhận dạng các vật thể, đến sau này.

Blogger và lập trình viên với chuyên môn về Machine Learning Deep Learning topics. Daniel hy vọng giúp đỡ người khác sử dụng sức mạnh của AI cho lợi ích xã hội.