AI 101

Những gì là Mạng nơ-ron Nhân tạo (ANNs)?

mm

Những gì là Mạng nơ-ron Nhân tạo (ANNs)?

Nhiều tiến bộ lớn trong lĩnh vực Trí tuệ nhân tạo (AI) được đẩy mạnh bởi mạng nơ-ron nhân tạo. Mạng nơ-ron nhân tạo (ANNs) là sự kết nối của các hàm toán học được kết hợp với nhau trong một định dạng được lấy cảm hứng từ mạng nơ-ron trong não bộ con người. Những ANN này có khả năng trích xuất các mẫu phức tạp từ dữ liệu, áp dụng các mẫu này vào dữ liệu chưa được xem để phân loại / nhận dạng dữ liệu. Theo cách này, máy tính “học”. Đó là một cái nhìn tổng quan nhanh về mạng nơ-ron, nhưng hãy cùng xem xét kỹ hơn về mạng nơ-ron để hiểu rõ hơn về chúng và cách chúng hoạt động.

Perceptron nhiều lớp được giải thích

Trước khi chúng ta xem xét các mạng nơ-ron phức tạp hơn, chúng ta sẽ dành một chút thời gian để xem xét một phiên bản đơn giản của ANN, một Perceptron nhiều lớp (MLP).

Hãy tưởng tượng một dây chuyền sản xuất tại một nhà máy. Trên dây chuyền sản xuất này, một công nhân nhận một vật phẩm, thực hiện một số điều chỉnh trên nó và sau đó chuyển nó sang công nhân tiếp theo trong dây chuyền, người thực hiện điều tương tự. Quá trình này tiếp tục cho đến khi công nhân cuối cùng trong dây chuyền hoàn thiện vật phẩm và đặt nó lên một băng chuyền sẽ mang nó ra khỏi nhà máy. Trong ẩn dụ này, có nhiều “lớp” trong dây chuyền sản xuất, và sản phẩm di chuyển giữa các lớp khi chúng di chuyển từ công nhân này sang công nhân khác. Dây chuyền sản xuất cũng có một điểm vào và một điểm ra.

Một Perceptron nhiều lớp có thể được coi là một dây chuyền sản xuất rất đơn giản, bao gồm ba lớp tổng cộng: một lớp nhập, một lớp ẩn và một lớp xuất. Lớp nhập là nơi dữ liệu được đưa vào MLP, và trong lớp ẩn, một số “công nhân” xử lý dữ liệu trước khi chuyển nó sang lớp xuất, cung cấp sản phẩm cho thế giới bên ngoài. Trong trường hợp của MLP, những “công nhân” này được gọi là “nơ-ron” (hoặc đôi khi là “nút”) và khi chúng xử lý dữ liệu, chúng thao tác nó thông qua một loạt các hàm toán học.

Trong mạng, có các cấu trúc kết nối nút với nút được gọi là “trọng số“. Trọng số là một giả định về cách các điểm dữ liệu liên quan khi chúng di chuyển qua mạng. Để nói một cách khác, trọng số phản ánh mức độ ảnh hưởng mà một nơ-ron có đối với một nơ-ron khác. Trọng số đi qua một “hàm kích hoạt” khi chúng rời khỏi nút hiện tại, đó là một loại hàm toán học biến đổi dữ liệu. Chúng biến đổi dữ liệu tuyến tính thành các biểu diễn phi tuyến, cho phép mạng phân tích các mẫu phức tạp.

Ẩn dụ về não bộ con người được ngụ ý bởi “mạng nơ-ron nhân tạo” xuất phát từ thực tế là các nơ-ron tạo nên não bộ con người được kết nối với nhau theo cách tương tự như các nút trong một ANN được liên kết.

Mặc dù perceptron nhiều lớp đã tồn tại từ những năm 1940, nhưng có một số hạn chế đã ngăn cản chúng trở nên đặc biệt hữu ích. Tuy nhiên, trong suốt hai thập kỷ qua, một kỹ thuật gọi là “sự lan truyền ngược” đã được tạo ra, cho phép các mạng điều chỉnh trọng số của các nơ-ron và do đó học hỏi hiệu quả hơn. Sự lan truyền ngược thay đổi trọng số trong mạng nơ-ron, cho phép mạng nắm bắt các mẫu thực sự trong dữ liệu một cách tốt hơn.

Mạng nơ-ron sâu

Mạng nơ-ron sâu lấy hình thức cơ bản của MLP và làm cho nó lớn hơn bằng cách thêm nhiều lớp ẩn ở giữa mô hình. Vì vậy, thay vì có một lớp nhập, một lớp ẩn và một lớp xuất, có nhiều lớp ẩn ở giữa và đầu ra của một lớp ẩn trở thành đầu vào cho lớp ẩn tiếp theo cho đến khi dữ liệu đã đi qua toàn bộ mạng và được trả lại.

Các lớp ẩn nhiều của mạng nơ-ron sâu có thể giải thích các mẫu phức tạp hơn so với perceptron nhiều lớp truyền thống. Các lớp khác nhau của mạng nơ-ron sâu học các mẫu của các phần khác nhau của dữ liệu. Ví dụ, nếu dữ liệu đầu vào bao gồm hình ảnh, phần đầu tiên của mạng có thể giải thích độ sáng hoặc tối của các pixel trong khi các lớp sau sẽ chọn ra các hình dạng và cạnh mà có thể được sử dụng để nhận dạng các vật thể trong hình ảnh.

Các loại Mạng nơ-ron khác nhau

Có nhiều loại mạng nơ-ron, và mỗi loại mạng nơ-ron có ưu và nhược điểm riêng (và do đó có các trường hợp sử dụng riêng). Loại mạng nơ-ron sâu được mô tả ở trên là loại mạng nơ-ron phổ biến nhất và thường được gọi là mạng nơ-ron tiến hành.

Một biến thể của mạng nơ-ron là Mạng nơ-ron hồi quy (RNN). Trong trường hợp của Mạng nơ-ron hồi quy, các cơ chế vòng lặp được sử dụng để giữ lại thông tin từ các trạng thái phân tích trước, có nghĩa là chúng có thể giải thích dữ liệu nơi thứ tự quan trọng. RNN hữu ích trong việc suy dẫn các mẫu từ dữ liệu tuần tự / thời gian. Mạng nơ-ron hồi quy có thể là đơn hướng hoặc song hướng. Trong trường hợp của mạng nơ-ron song hướng, mạng có thể lấy thông tin từ sau này trong chuỗi cũng như từ các phần trước của chuỗi. Vì mạng nơ-ron song hướng xem xét nhiều thông tin hơn, nên nó có khả năng suy dẫn các mẫu chính xác hơn từ dữ liệu.

Một Mạng nơ-ron tích chập là một loại mạng nơ-ron đặc biệt có khả năng giải thích các mẫu được tìm thấy trong hình ảnh. Một CNN hoạt động bằng cách di chuyển một bộ lọc qua các pixel của hình ảnh và đạt được một biểu diễn số của các pixel trong hình ảnh, mà nó có thể phân tích để tìm các mẫu. Một CNN được cấu trúc để các lớp tích chập rút các pixel ra khỏi hình ảnh trước, và sau đó các lớp tiến hành kết nối dày đặc đến, những lớp sẽ thực sự học cách nhận dạng các vật thể, đến sau này.

Blogger và lập trình viên với chuyên môn về Machine Learning Deep Learning topics. Daniel hy vọng giúp đỡ người khác sử dụng sức mạnh của AI cho lợi ích xã hội.