Lãnh đạo tư tưởng

Tại Sao Bảo Mật Dữ Liệu Sẽ Là Vấn Đề Công Nghệ Định Hình Năm 2024

Published February 26, 2024

Updated April 4, 2026

William Belov

Trong ánh đèn sân khấu của thế giới công nghệ, các rô-bốt trò chuyện được thúc đẩy bởi trí tuệ nhân tạo như ChatGPT đang thu hút sự chú ý, làm thay đổi các ngành công nghiệp như chúng ta biết. Với mỗi bước tiến, các vai trò truyền thống đang dần trở nên lỗi thời – các nhà văn, chuyên gia tiếp thị, thậm chí cả chuyên gia CNTT đều thấy mình bị đe dọa mất việc. Vào tháng 6 năm 2023 alone, một con số đáng kinh ngạc 3,900 người Mỹ mất việc của họ cho trí tuệ nhân tạo. Tuy nhiên, sự gián đoạn này chỉ là tiền đề cho những gì đang chờ đợi.

Khi trí tuệ nhân tạo tiếp tục chinh phục các ngành công nghiệp, một làn sóng lo ngại về việc xâm phạm bản quyền và vi phạm quyền riêng tư đang gia tăng. Câu hỏi lớn đang được đặt ra: làm thế nào chúng ta có thể đảm bảo sự cân bằng tinh tế giữa tiến bộ và quyền riêng tư?

Nguồn gốc của mối quan ngại

Để bắt đầu, hãy cho tôi giải thích cách các mô hình trí tuệ nhân tạo như ChatGPT hoạt động. Chúng tạo ra kết quả dựa trên dữ liệu mà chúng học được trong quá trình đào tạo. Nếu mô hình có thể tạo ra văn bản giống như thể nó được viết bởi Shakespeare trong cùng một phong cách văn học Anh cổ, điều đó có nghĩa là nó đã “nhìn thấy” nội dung đó trước trong quá trình chuẩn bị, trước khi được phát hành.

Trên thực tế, các thuật toán học máy (ML) đằng sau mỗi mô hình trí tuệ nhân tạo được đào tạo trên lượng lớn dữ liệu để thực hiện tốt. Ví dụ, có những hệ thống giúp các bác sĩ trong chẩn đoán – chúng phân tích các bản quét CT và tìm thấy các bất thường có thể chỉ ra các bệnh cụ thể như ung thư phổi. Chúng thường được đào tạo trên hàng triệu hình ảnh y tế. Nếu không có chúng, chúng không thể nhận ra các hiện tượng trên các bản quét.

Khi nhu cầu về các công cụ trí tuệ nhân tạo tăng theo cấp số nhân, các gã khổng lồ công nghệ đang ngày càng thu thập lượng lớn dữ liệu để đào tạo mô hình của họ. Và đôi khi dữ liệu đó bao gồm thông tin nhạy cảm về người và tổ chức. Hơn nữa, nó thường được thu thập thông qua việc thu thập hàng triệu trang web mà không có thỏa thuận từ các chủ sở hữu.

Điều này làm dấy lên mối quan ngại của công chúng về quyền riêng tư, minh bạch và kiểm soát thông tin cá nhân trên internet. Một khảo sát của Deloitte năm 2023 tiết lộ rằng đa số người được hỏi mong muốn có nhiều bảo vệ và kiểm soát hơn về cách dữ liệu của họ được sử dụng. Gần chín trong số mười người được hỏi muốn xem và xóa dữ liệu đã thu thập, với 80% cảm thấy họ xứng đáng được bồi thường cho các công ty lợi dụng dữ liệu của họ. Tại Hoa Kỳ alone, công dân đã trở nên lo lắng hơn về cách dữ liệu của họ được sử dụng, với khoảng bảy trong số mười người trưởng thành (71%) chia sẻ mối quan ngại này, tăng từ 64% vào năm 2019.

Trận chiến pháp lý

Ngoài ra, một số tổ chức đang đưa những vấn đề này ra tòa. Theo Fortune, tính đến tháng 11 năm 2023, có hơn 100 vụ kiện liên quan đến trí tuệ nhân tạo đang đi qua hệ thống pháp lý. Những vụ kiện này bao gồm một loạt các mối quan ngại, bao gồm tranh chấp về quyền sở hữu trí tuệ, sự lan truyền của nội dung có hại và các trường hợp phân biệt đối xử.

Trong số những vụ kiện này có các vụ kiện được nộp bởi các nghệ sĩ, những người cáo buộc các nhà phát triển học sâu và mô hình văn bản-sang-hình ảnh như Stable Diffusion và Midjourney đã sử dụng nghệ thuật kỹ thuật số của họ trong đào tạo trí tuệ nhân tạo mà không có sự đồng ý. Họ cho rằng rằng các công ty đứng sau những sản phẩm này đã thu thập hàng tỷ hình ảnh từ internet, bao gồm cả của họ, để hướng dẫn mô hình tạo ra hình ảnh của riêng chúng.

Vào tháng 12 năm 2023, tờ báo lớn của Mỹ The New York Times đã tham gia vào các trận chiến pháp lý này bằng cách kiện OpenAI, nhà phát triển đứng sau ChatGPT đang thịnh hành, vì vi phạm bản quyền. Vụ kiện nhấn mạnh rằng hàng triệu bài báo được xuất bản bởi các tổ chức truyền thông đã được sử dụng để đào tạo rô-bốt trò chuyện tự động, hiện đang cạnh tranh với tờ báo như một nguồn thông tin đáng tin cậy.

Vấn đề trong tương lai

Để đáp lại những mối quan ngại cấp bách này, các chính phủ trên toàn thế giới đang tập hợp lại để đối mặt với những lo lắng của công chúng. Ví dụ, các đại diện từ mười hai cơ quan quản lý trên toàn cầu đã phát hành một tuyên bố chung vào tháng 8 năm 2023, tập trung vào việc thu thập dữ liệu và bảo vệ quyền riêng tư. Tuyên bố này đến từ các cơ quan có thẩm quyền ở Argentina, Úc, Canada, Colombia, Hồng Kông, Jersey, Mexico, Morocco, New Zealand, Na Uy, Thụy Sĩ và Vương quốc Anh. Trong khi đó, tại California, Đạo luật Xóa đã được ký thành luật, nhắm vào các nhà môi giới dữ liệu và thiết lập các quy định bổ sung cho việc thu thập và quản lý dữ liệu cá nhân.

Mặc dù có những nỗ lực chung, tôi dự đoán rằng các vấn đề về quyền riêng tư và quyền sở hữu dữ liệu sẽ tiếp tục giữ được vị trí hàng đầu trong diễn đàn công cộng trong suốt năm 2024 và hơn thế nữa. Hơn nữa, sự gia tăng của các vụ kiện về quyền sở hữu trí tuệ chỉ là dấu hiệu của bề mặt tảng băng. Chúng ta có thể sẽ chứng kiến sự gia tăng của các vụ kiện tập trung vào độ chính xác và an toàn của dữ liệu, đặc biệt là trong bối cảnh lan rộng của các bản sao giả mạo và thông tin sai lệch.

Mặc dù cả lĩnh vực chính phủ và kinh doanh phải tăng cường nỗ lực, một cách tiếp cận thận trọng là điều cần thiết. Mặc dù có những lo ngại ngày càng tăng, đáng chú ý là dữ liệu mở vẫn tiếp tục đóng vai trò quan trọng trong việc thúc đẩy nghiên cứu và phát triển. Hãy lấy ví dụ về vai trò vô giá của việc truy cập công khai vào hồ sơ sức khỏe trong cuộc khủng hoảng COVID-19, giúp đẩy nhanh sự phát triển của các đột phá y học cứu sống như vắc-xin được tiên phong bởi Moderna và Pfizer.

Tầm quan trọng của dữ liệu mở được nhấn mạnh bởi ví dụ lịch sử của Dự án Bộ gen Người Hoa Kỳ, nơi việc chia sẻ công khai dữ liệu gen đã biến đổi nghiên cứu di truyền. Theo cách tương tự, trí tuệ nhân tạo phân tích và học hỏi từ dữ liệu có thể mang lại lợi ích cho xã hội, từ việc phân loại đột biến gen đến giải quyết các thách thức cấp bách như biến đổi khí hậu.

Trong kinh doanh, dữ liệu được thu thập bởi các công cụ thu thập web là vô giá cho thông tin thị trường, theo dõi đối thủ và nhận biết các xu hướng phổ biến. Nếu việc thu thập web trở nên hạn chế hơn, các công ty có thể phải đối mặt với việc hạn chế truy cập vào dữ liệu quan trọng để đưa ra quyết định thông minh, có thể dẫn đến giảm cạnh tranh và minh bạch trong định giá, cản trở sự đổi mới và trải nghiệm người dùng kém do cập nhật dữ liệu chậm và không chính xác.

Tuy nhiên, giữa những thách thức đang phát triển này, có những cách để đối mặt với chúng một cách trực diện. Tôi đặt niềm tin vào sức mạnh của các công nghệ trung gian để điều hướng những vùng nước đầy sóng gió này. Những công nghệ đổi mới này che giấu địa chỉ IP ban đầu của người dùng, kênh hoạt động trực tuyến của họ thông qua các máy chủ thay thế. Không chỉ chúng tăng cường bảo mật dữ liệu, mà chúng còn xuất hiện như những công cụ không thể thiếu trong việc hài hòa tiến bộ công nghệ với việc bảo vệ các quyền tự do cá nhân.

Related Topics:data privacy Privacy thought leaders

William Belov

William Belov là CEO của Infatica, một mạng lưới proxy toàn cầu hàng đầu. Kinh nghiệm của ông bao gồm đầu tư, sáp nhập và mua lại, cũng như các công nghệ khác, tất cả đều được hỗ trợ bởi sự tập trung dành riêng cho phát triển kinh doanh. William nắm giữ hai bằng MD và một EMBA.