Góc nhìn Anderson

Sử dụng Trí tuệ nhân tạo (AI) có thể làm cho các nhiệm vụ mất nhiều thời gian hơn, nghiên cứu cho thấy

mm
AI-generated image (GPT-2): A man sits at breakfast while a group of identical domestic robots shave him, cut his hair, prepare his food, and clean the house around him, turning even the smallest daily tasks into outsourced labor.

Nghiên cứu mới cho thấy AI có thể làm cho các nhiệm vụ đơn giản mất nhiều thời gian hơn, trong khi thuyết phục người dùng rằng họ đang trở nên năng suất hơn.

 

Một nghiên cứu mới từ Stanford, NYU và Princeton đã phát hiện ra rằng chúng ta thường sử dụng AI ngay cả khi nó không hiệu quả; và rằng đối với các nhiệm vụ nhỏ mà chúng ta thường giao cho AI, chúng ta thường sẽ tốn ít công sức hơn và tiết kiệm thời gian hơn nếu tự làm nhiệm vụ đó.

Trong ba nghiên cứu trên người được ủy thác cho nghiên cứu, các tác giả đã tìm thấy rằng những người tham gia thường đánh giá thấp thời gian mà AI sẽ tiết kiệm cho họ trên một nhiệm vụ được đề xuất, cũng như đánh giá thấp đáng kể mức độ phụ thuộc vào AI và thực tế sử dụng AI*.

‘Trong [nghiên cứu thứ hai], chúng tôi tìm cách hiểu tại sao người dùng có thể sử dụng AI cho các nhiệm vụ đơn giản mặc dù việc sử dụng AI không mang lại lợi ích về hiệu suất. Một giả thuyết là người dùng không chính xác về lượng thời gian và công sức mà AI tiết kiệm.

‘Để kiểm tra giả thuyết này, chúng tôi so sánh giữa dự đoán và thực tế về thời gian và công sức hoàn thành các nhiệm vụ với và không có sự hỗ trợ của AI và xác định ảo giác về lợi ích hiệu suất, nơi người dùng đánh giá cao cả thời gian và công sức mà AI tiết kiệm.

‘Trung bình, người dùng dự đoán rằng AI sẽ tiết kiệm thời gian bằng 55,7 giây khi nó chỉ tiết kiệm 7,5 giây. Sự đánh giá thấp này đặc biệt nghiêm trọng đối với các biến thể nhiệm vụ đơn giản, nơi người dùng dự đoán rằng AI sẽ tiết kiệm thời gian, nhưng thực tế nó làm cho nhiệm vụ mất nhiều thời gian hơn để hoàn thành.’

Bài báo mới, có tiêu đề Ảo giác về lợi ích hiệu suất: Người dùng đánh giá thấp tốc độ sử dụng AI và đánh giá cao lợi ích của nó trên các nhiệm vụ đơn giản, được viết bởi bảy tác giả từ ba cơ sở, cũng tìm thấy rằng việc sử dụng AI trước đó có vẻ củng cố việc sử dụng AI trong tương lai, ngay cả khi công nghệ không mang lại lợi ích hiệu suất thực sự.

Tổng quan về ba thí nghiệm được sử dụng để kiểm tra cách người dùng sử dụng AI cho các nhiệm vụ hàng ngày đơn giản, cho thấy người dùng đánh giá thấp mức độ phụ thuộc vào AI, đánh giá cao thời gian nó tiết kiệm và trở nên có nhiều khả năng sử dụng nó lại sau khi tiếp xúc trước đó. Nguồn - https://arxiv.org/pdf/2605.22687

Tổng quan về ba thí nghiệm được sử dụng để kiểm tra cách người dùng sử dụng AI cho các nhiệm vụ hàng ngày đơn giản, cho thấy người dùng đánh giá thấp mức độ phụ thuộc vào AI, đánh giá cao thời gian nó tiết kiệm và trở nên có nhiều khả năng sử dụng nó lại sau khi tiếp xúc trước đó. Nguồn

Dữ liệu từ ba nghiên cứu cho thấy rằng người dùng trở nên có nhiều khả năng sử dụng AI sau khi tiếp xúc trước đó, ngay cả khi nó không mang lại lợi ích về hiệu suất hoặc giảm căng thẳng (tức là, tốn ít công sức hơn cho nhiệm vụ)*:

‘Trái với khả năng rằng kinh nghiệm cải thiện sự đánh giá [tức là, khả năng ước tính hiệu suất của AI], chúng tôi xác định một hiệu ứng mang theo phiên nơi việc sử dụng AI ban đầu làm tăng việc sử dụng AI sau đó.

‘Những người tham gia đã hoàn thành nhiệm vụ với sự hỗ trợ của AI trở nên có nhiều khả năng chọn AI cho các biến thể nhiệm vụ dễ dàng hơn, ngay cả khi việc đó không mang lại lợi ích về thời gian hoặc công sức trên trung bình.’

Trong một trong những nghiên cứu trên người, các tác giả đã tìm thấy rằng lợi ích tiết kiệm từ việc sử dụng AI hoàn toàn là ảo:

‘Sự hỗ trợ của AI có thể phản tác dụng. Chúng tôi đã tìm thấy rằng những người chọn sử dụng AI đã mất 7,06 giây nhiều hơn so với những người hoàn thành nhiệm vụ một mình và báo cáo nỗ lực cao hơn.’

Nghiên cứu này chỉ giới hạn ở các nhiệm vụ mất ít hơn năm phút, nhưng nó có thể phù hợp với những người trước đây đã nghiện các công cụ tìm kiếm và hiện đang thường xuyên sử dụng ChatGPT và các mô hình ngôn ngữ lớn khác để tự động hóa các nhiệm vụ đơn giản.

Nhóm nghiên cứu

Trong các nghiên cứu trên người khác nhau, các nhiệm vụ được thiết kế dựa trên khuôn khổ Taxonomy of User Needs and Actions (TUNA). Các thí nghiệm bao gồm tìm kiếm thông tin; tóm tắt; toán học; sửa lỗi chính tả; viết lại; và các nhiệm vụ thấp khác có thể được hoàn thành trong ít hơn năm phút.

Nghiên cứu đầu tiên so sánh sự sẵn sàng dự đoán của người tham gia để sử dụng AI với hành vi thực tế của họ trong quá trình hoàn thành nhiệm vụ, điều tra xem người dùng có hiểu chính xác về sự phụ thuộc của họ vào sự hỗ trợ của AI hay không.

Nghiên cứu thứ hai tập trung vào lợi ích hiệu suất thực tế so với dự đoán, bằng cách so sánh dự đoán của người tham gia về thời gian và công sức tiết kiệm với thời gian và công sức thực tế khi hoàn thành nhiệm vụ với và không có sự hỗ trợ của AI.

Nghiên cứu thứ ba kiểm tra xem việc tiếp xúc trước đó với AI có thay đổi quyết định sau này hay không, theo dõi xem những người tham gia đã hoàn thành nhiệm vụ với AI trước đó có trở nên có nhiều khả năng phụ thuộc vào AI trong các nhiệm vụ sau đó hay không.

Quá trình suy nghĩ quá mức – Sử dụng AI cho các nhiệm vụ đơn giản

Để hiểu xem người dùng có đánh giá chính xác về sự phụ thuộc của họ vào AI hay không, người tham gia trong một phiên đã được yêu cầu hoàn thành bốn nhiệm vụ, với tùy chọn sử dụng sự hỗ trợ của AI cho mỗi nhiệm vụ. Mức độ mà người tham gia thực sự sử dụng AI được so sánh với ước tính trước đó của họ về mức độ họ nhìn thấy sẽ sử dụng nó, với sự khác biệt đáng kể trong kết quả:

Người tham gia liên tục đánh giá thấp tần suất họ sẽ chuyển sang AI cho các nhiệm vụ đơn giản, với khoảng cách mở rộng trên các lời nhắc dễ dàng hơn nơi tần suất sử dụng AI thực tế tăng lên 38% so với tỷ lệ dự đoán là 20%, cho thấy rằng việc ủy thác cho AI đã trở thành một thói quen vượt quá nhận thức của người dùng.

Người tham gia liên tục đánh giá thấp tần suất họ sẽ chuyển sang AI cho các nhiệm vụ đơn giản, với khoảng cách mở rộng trên các lời nhắc dễ dàng hơn nơi tần suất sử dụng AI thực tế tăng lên 38% so với tỷ lệ dự đoán là 20%, cho thấy rằng việc ủy thác cho AI đã trở thành một thói quen vượt quá nhận thức của người dùng.

Các tác giả cho biết:

‘Chúng tôi đã tìm thấy rằng người dùng thực sự đã sử dụng AI nhiều hơn so với tỷ lệ dự đoán trung bình. Người tham gia báo cáo rằng họ sẽ sử dụng AI trong 33% nhiệm vụ, nhưng tỷ lệ sử dụng AI trên toàn dân là 47% (β = 1,07, p < 0,001).

‘Khoảng cách này lớn hơn đối với các biến thể nhiệm vụ dễ dàng (β = 0,69, p < 0,001): người tham gia dự đoán tỷ lệ sử dụng AI là 20% nhưng tỷ lệ sử dụng AI thực tế là 38% (β = 1,42, p < 0,001), gần như gấp đôi tỷ lệ dự đoán.’

Các thí nghiệm tập trung vào các nhiệm vụ thông thường, ít công sức mà nhiều người hiện đang thường xuyên giao cho AI, ngay cả khi việc đó có thể không cần thiết. Người tham gia được yêu cầu thực hiện các hoạt động đơn giản liên quan đến việc nhớ lại sự kiện; toán học; sửa lỗi chính tả; viết lại đoạn văn ngắn; tóm tắt văn bản; và trả lời các câu hỏi lý luận cơ bản, với một số nhiệm vụ chỉ yêu cầu một vài từ hoặc một câu để hoàn thành.

Nghiên cứu cũng bao gồm các phiên bản khó hơn của cùng một hoạt động, cho phép các nhà nghiên cứu so sánh xem việc sử dụng AI có thay đổi khi công việc trở nên đòi hỏi hơn.

Lợi ích tiết kiệm thời gian của AI bị đánh giá cao

Trong nghiên cứu thứ hai, người tham gia được chia thành hai nhóm riêng biệt, với một nhóm đầu tiên ước tính thời gian và công sức mà AI sẽ tiết kiệm cho một loạt nhiệm vụ, trong khi nhóm khác thực sự hoàn thành các nhiệm vụ đó với hoặc không có sự hỗ trợ của AI. Các nhiệm vụ một lần nữa tập trung vào các hoạt động thấp như toán học, viết lại, nhớ lại sự kiện, tóm tắt, sửa lỗi chính tả và các bài tập lý luận ngắn.

Mục tiêu là so sánh dự đoán của người dùng về năng suất của AI với những gì thực sự xảy ra khi công việc được thực hiện. Theo bài báo, người tham gia liên tục đánh giá cao lợi ích của AI, đặc biệt là trên các nhiệm vụ dễ dàng mà nhiều người cho rằng AI sẽ giảm đáng kể thời gian và công sức.

Thay vào đó, kết quả đo lường thường chỉ ra lợi ích nhỏ, và trong một số trường hợp, việc sử dụng AI thực sự làm chậm người tham gia. Bài báo cho biết người dùng dự đoán rằng sự hỗ trợ của AI sẽ tiết kiệm gần một phút, trong khi lợi ích tiết kiệm thời gian thực tế chỉ là vài giây.

Trên một số nhiệm vụ đơn giản, những người sử dụng AI thực sự mất nhiều thời gian hơn để hoàn thành so với những người hoàn thành công việc độc lập:

Dự đoán so với thời gian và công sức thực tế trong quá trình hoàn thành nhiệm vụ với sự hỗ trợ của AI và độc lập, cho thấy 'ảo giác về tốc độ' được đề xuất trong bài báo, trong đó người tham gia liên tục tin rằng AI sẽ tiết kiệm nhiều thời gian hơn so với thực tế.

Dự đoán so với thời gian và công sức thực tế trong quá trình hoàn thành nhiệm vụ với sự hỗ trợ của AI và độc lập, cho thấy ‘ảo giác về tốc độ’ được đề xuất trong bài báo, trong đó người tham gia liên tục tin rằng AI sẽ tiết kiệm nhiều thời gian hơn so với thực tế.

Nghiên cứu cũng kiểm tra công sức tinh thần nhận thức. Người tham gia thường tin rằng AI sẽ làm cho nhiệm vụ cảm thấy dễ dàng hơn nhiều; tuy nhiên, sự giảm công sức nhận thức đo lường được thực sự nhỏ hơn nhiều so với dự đoán. Bài báo mô tả điều này là một ‘ảo giác về lợi ích hiệu suất’, trong đó người dùng hệ thống đánh giá cao cả tốc độ và hữu ích của sự hỗ trợ của AI trong công việc hàng ngày đơn giản.

Sử dụng AI làm sâu sắc thêm ảo giác

Nghiên cứu cuối cùng được thiết kế để kiểm tra xem việc tiếp xúc ngắn với AI có thay đổi quyết định sau này hay không. Người tham gia được chia thành nhiều nhóm và trước tiên đi qua một ‘giai đoạn tiếp xúc’, nơi một số người hoàn thành nhiệm vụ dễ dàng với sự hỗ trợ của AI; một số người hoàn thành nhiệm vụ khó hơn với sự hỗ trợ của AI; và những người khác hoàn thành cùng một loại nhiệm vụ độc lập, không có AI. Một nhóm kiểm soát riêng biệt bỏ qua giai đoạn nhiệm vụ hoàn toàn.

Sau đó, tất cả các nhóm đều đi vào một ‘giai đoạn kiểm tra’ thứ hai, lần này được đưa ra các nhiệm vụ mới và dễ dàng, và được phép tự quyết định xem có sử dụng AI hay không. Các nhiệm vụ một lần nữa tập trung vào các hoạt động thấp (tức là, viết lại, toán học, nhớ lại, sửa lỗi chính tả, tóm tắt và các bài tập lý luận ngắn), mỗi nhiệm vụ có thể được hoàn thành trong vài phút.

Bài báo cho biết những người tham gia đã sử dụng AI trong giai đoạn tiếp xúc trước đó trở nên có nhiều khả năng phụ thuộc vào nó một lần nữa sau đó, ngay cả khi việc sử dụng AI trước đó không tiết kiệm thời gian hoặc công sức.

Những người nghiên cứu đã tìm thấy rằng những người tham gia trước đó đã sử dụng AI chọn sự hỗ trợ của AI thường xuyên hơn trong giai đoạn kiểm tra sau này so với những người tham gia đã hoàn thành nhiệm vụ độc lập:

Những người tham gia đã sử dụng AI trong giai đoạn tiếp xúc trước đó trở nên có nhiều khả năng phụ thuộc vào nó một lần nữa trong các nhiệm vụ sau đó, mặc dù việc sử dụng AI trước đó thường không mang lại lợi ích đáng kể về tốc độ hoặc công sức. Bảng điều khiển bên trái cho thấy những người dùng AI trước đó chọn sự hỗ trợ của AI thường xuyên hơn trong giai đoạn kiểm tra sau này so với những người tham gia đã hoàn thành nhiệm vụ độc lập. Bảng điều khiển bên phải minh họa 'ảo giác về tốc độ' được đề xuất trong bài báo, trong đó việc tiếp xúc trước đó với AI làm tăng niềm tin của người tham gia rằng công việc được hỗ trợ bởi AI nhanh hơn và hiệu quả hơn, mặc dù thời gian hoàn thành đo lường thường cho thấy ít lợi ích và đôi khi hiệu suất chậm hơn.

Những người tham gia đã sử dụng AI trong giai đoạn tiếp xúc trước đó trở nên có nhiều khả năng phụ thuộc vào nó một lần nữa trong các nhiệm vụ sau đó, mặc dù việc sử dụng AI trước đó thường không mang lại lợi ích đáng kể về tốc độ hoặc công sức. Bảng điều khiển bên trái cho thấy những người dùng AI trước đó chọn sự hỗ trợ của AI thường xuyên hơn trong giai đoạn kiểm tra sau này so với những người tham gia đã hoàn thành nhiệm vụ độc lập. Bảng điều khiển bên phải minh họa ‘ảo giác về tốc độ’ được đề xuất trong bài báo, trong đó việc tiếp xúc trước đó với AI làm tăng niềm tin của người tham gia rằng công việc được hỗ trợ bởi AI nhanh hơn và hiệu quả hơn, mặc dù thời gian hoàn thành đo lường thường cho thấy ít lợi ích và đôi khi hiệu suất chậm hơn.

Việt tiếp xúc lặp lại với AI được báo cáo là làm sai lệch phán đoán của người tham gia về việc liệu AI có thực sự hữu ích hay không: những người đã sử dụng AI trở nên ít có khả năng đồng ý rằng nhiệm vụ có thể được hoàn thành nhanh hơn mà không có nó, mặc dù kết quả đo lường thường cho thấy ít lợi ích và trong một số trường hợp, thời gian hoàn thành chậm hơn.

Những người nghiên cứu cho rằng điều này tạo ra điều kiện cho một ‘chu kỳ tự củng cố’, trong đó việc sử dụng AI làm tăng sự phụ thuộc vào AI trong tương lai, đồng thời làm suy yếu khả năng của người dùng trong việc đánh giá chính xác liệu công nghệ có cải thiện năng suất hay không.

Kết luận

Ý kiến Nhiều người đọc đã áp dụng AI cho các nhiệm vụ nhỏ có thể cảm thấy quen thuộc với kết luận của bài báo mới.

Cá nhân tôi, sự ám ảnh của tôi để tự động hóa các nhiệm vụ lặp đi lặp lại đã bắt đầu từ vài thập kỷ trước, trước khi AI bùng nổ. Giờ đây, cũng như trước đây, câu hỏi vẫn còn: Liệu nỗ lực cần thiết để thiết lập và/hoặc duy trì tự động hóa có vượt quá nỗ lực ước tính (chỉ của con người) trong việc thực hiện nhiệm vụ mà không có tự động hóa?

Những người yêu thích tự động hóa có thể sẽ tự động hóa vì lợi ích của nó, ngay cả khi nó có thể mất nhiều năm hoặc nhiều thập kỷ trước khi có bất kỳ lợi ích nào (theo nghĩa là thời gian tiết kiệm) sẽ trở nên rõ ràng; và điều này thay đổi bối cảnh của hoạt động từ ‘tối ưu hóa’ thành ‘sở thích’.

Không có gì sai khi làm như vậy, miễn là bạn không tự lừa dối mình rằng những lợi ích thực sự đang được thực hiện. Tuy nhiên, đây là một thói quen xấu mà tôi đã cố gắng chống lại trong những năm gần đây; và tùy chọn sử dụng AI, gần đây, dường như dễ bị làm trầm trọng thêm bởi nó, vì ngay cả những kết quả không tốt hoặc không tối ưu cũng có thể được thu được nhanh hơn so với, ví dụ, khi viết macro trong JavaScript và các ngôn ngữ khác.

Chỉ số lừa đảo

Điều mà bài báo bỏ qua một chút là sự căng thẳng giữa may mắn hoặc kết quả may mắn thông qua AI so với sự phổ biến của các ngõ cụt và nỗ lực thất bại để phù hợp với các rô-bốt trò chuyện AI như ChatGPT với nhu cầu của bạn – trong một quy trình làm việc mà bạn có thể dựa vào, ngay cả khi phải nâng cấp lên các phiên bản mới có thể không hoạt động theo cùng một cách như phiên bản mà quy trình làm việc hoặc thói quen của bạn được điều kiện.

Một ‘kết quả ma thuật’ là khi AI ngay lập tức giải quyết vấn đề của bạn theo một cách hợp lý và dễ dàng.

Ví dụ, mỗi khi tôi xem xét một bài báo, tôi phải in nó ra và cuối cùng phải viết số trang ở trên cùng bằng chữ đậm, vì chúng thường bị thiếu hoặc ở dạng chữ nhỏ ở dưới cùng. Yêu cầu ChatGPT tạo một kịch bản Python để thêm một số trang lớn và đậm ở trên cùng đã cho thấy một kết quả cực kỳ nhanh, vì tôi có thể kéo một tệp PDF Arxiv vào một tệp .BAT và có một phiên bản mới với số trang nổi bật trong 2-3 giây:

Số trang nổi bật được thêm vào tệp PDF thông qua một kịch bản Python được AI viết.

Số trang nổi bật được thêm vào tệp PDF thông qua một kịch bản Python được AI viết.

Besides một hoặc hai phút tranh luận về việc liệu Windows có phông chữ Arial Black riêng biệt hay không (nó không còn nữa), đây có thể là lần nhanh nhất AI đã tạo ra một thứ gì đó hữu ích và thường xuyên cho tôi.

Được tranh luận, loại ‘phá vỡ’ hoặc ‘thắng dễ’ này mang lại một ấn tượng sai về khả năng thực sự của AI trong việc tiết kiệm thời gian và/hoặc công sức: chúng ta có xu hướng giảm các ký ức đau đớn hoặc tiêu cực và tái sử dụng hoặc tập trung vào các ký ức hạnh phúc có nghĩa là các trường hợp thành công mà AI giải quyết các nhiệm vụ nhỏ một cách hữu ích sẽ trở thành một ngôi sao dẫn đường mà chúng ta có thể theo đuổi, ngay cả khi điều đó đi ngược lại xu hướng bằng chứng thống kê, như được trình bày trong bài báo mới, và ngay cả khi những ‘chiến thắng dễ dàng’ như vậy là ngoại lệ chứ không phải quy tắc.

Có bằng chứng ngày càng tăng, ngoài bài báo mới, cho thấy chúng ta tự lừa dối mình về sự hữu ích của AI. Vào năm 2025, một nghiên cứu cho thấy rằng các nhà phát triển sử dụng AI đã mất 19% nhiều thời gian hơn; và một nghiên cứu gần đây hơn xác nhận thông điệp cơ bản của bài báo mới được thảo luận trong bài viết này – rằng tiết kiệm thời gian mất thời gian.

Nó sẽ hữu ích nếu nghiên cứu như vậy có thể được chuyển thành một (tất nhiên là được AI hỗ trợ) nghiên cứu thời gian và chuyển động cổ điển, cho phép chúng ta có cái nhìn thực sự về mức độ mà AI thực sự tiết kiệm thời gian cho chúng ta – hoặc tốn thời gian của chúng ta.

Cuối cùng, nghiên cứu này đặc biệt vì nó ít nhất cố gắng định lượng ‘công sức tinh thần’ liên quan đến việc sử dụng AI cho các nhiệm vụ nhỏ. Khi sự chú ý ngày càng tập trung vào ‘tính chất mãnh liệt’ của công việc được hỗ trợ bởi AI, chúng ta cần các đơn vị đo lường đáng tin cậy có thể định lượng mức độ mà các yêu cầu và đặc điểm của AI làm cạn kiệt hoặc cạn kiệt chúng ta, với chi phí chung về chất lượng công việc và khả năng làm việc.

 

* Định dạng là của các tác giả, từ bài báo nguồn. Bất kỳ trích dẫn nội tuyến nào được tôi chuyển đổi thành liên kết.

Được xuất bản lần đầu vào thứ Bảy, ngày 23 tháng 5 năm 2026

Nhà văn về học máy, chuyên gia lĩnh vực tổng hợp hình ảnh con người. Cựu trưởng nhóm nội dung nghiên cứu tại Metaphysic.ai.
Trang cá nhân: martinanderson.ai
Liên hệ: [email protected]