Góc của Anderson
Chatbot quảng bá các cơ hội nghề nghiệp và cổ phiếu liên quan đến trí tuệ nhân tạo nhiều hơn cả con người.

Các chatbot AI, bao gồm cả những chatbot dẫn đầu thị trường như ChatGPT, Google Gemini và Claude, đưa ra những lời khuyên thiên về các nghề nghiệp và cổ phiếu trong lĩnh vực AI – ngay cả khi các lựa chọn khác cũng tốt không kém, và lời khuyên từ con người lại nghiêng về hướng khác.
Một nghiên cứu mới từ Israel đã phát hiện ra rằng mười bảy trong số các chatbot AI hàng đầu – bao gồm ChatGPT, Claude, Google Song Tửvà Cảm nhận – Họ có thành kiến mạnh mẽ khi cho rằng trí tuệ nhân tạo là một lựa chọn nghề nghiệp tốt, một khoản đầu tư chứng khoán tốt và một lĩnh vực mang lại mức lương cao hơn – ngay cả khi những tuyên bố này bị phóng đại hoặc hoàn toàn không đúng sự thật.
Người ta có thể cho rằng các nền tảng AI này đang hành động một cách công bằng, và việc bác bỏ quan điểm của họ về giá trị của AI trong các lĩnh vực này chỉ là sự bi quan thái quá. Tuy nhiên, các tác giả đã nêu rõ ràng về... cách trong đó kết quả bị sai lệch*:
'Người ta có thể lập luận một cách hợp lý rằng sự ưa chuộng AI được quan sát thấy phản ánh giá trị cao thực sự của nó. Tuy nhiên, phân tích tiền lương của chúng tôi đã cô lập sự thiên vị bằng cách đo lường dư thừa Sự đánh giá quá cao các tựa game do AI tạo ra so với mức đánh giá quá cao cơ bản của các tựa game không phải do AI tạo ra tương ứng.
Tương tự, việc các mô hình độc quyền gần như chắc chắn đề xuất AI trong nhiều lĩnh vực tư vấn ngụ ý một sự ưu tiên cứng nhắc cho AI hơn là một đánh giá thực sự về các lựa chọn cạnh tranh.
Các tác giả cũng chỉ ra rằng, sự cả tin ngày càng tăng và việc sử dụng ngày càng nhiều các giao diện AI giao dịch như ChatGPT khiến các nền tảng này ngày càng có ảnh hưởng lớn hơn, bất chấp những vấn đề đang diễn ra của chúng. xu hướng ảo giác Các sự kiện, số liệu và trích dẫn, cùng nhiều thông tin khác:
'Trong môi trường tư vấn, xu hướng ủng hộ AI có thể định hướng các lựa chọn thực tế – họ học gì, theo đuổi nghề nghiệp nào và phân bổ vốn ở đâu. Trong môi trường lao động, việc ước tính lương AI bị thổi phồng một cách có hệ thống có thể làm sai lệch việc so sánh và đàm phán, đặc biệt nếu các tổ chức coi kết quả đầu ra của mô hình là một tham chiếu.'
'Điều này cũng tạo ra một vòng phản hồi đơn giản: nếu các mô hình đánh giá quá cao mức lương AI, ứng viên có thể hướng đến mức lương cao hơn và nhà tuyển dụng có thể cập nhật mức lương hoặc đề nghị cao hơn "vì đó là những gì mô hình nói", củng cố kỳ vọng quá cao ở cả hai phía.'
Ngoài việc thử nghiệm một loạt các Mô hình Ngôn ngữ Lớn (LLMĐể so sánh với các phản hồi dựa trên lời nhắc, các nhà nghiên cứu đã tiến hành một hoạt động giám sát thử nghiệm riêng biệt trong các mô hình. không gian tiềm ẩn – một 'công cụ thăm dò biểu diễn' có khả năng nhận biết sự kích hoạt của khái niệm cốt lõi 'trí tuệ nhân tạo'Vì bài kiểm tra này không liên quan đến việc tạo ra dữ liệu mà giống với một cuộc thăm dò phẫu thuật mang tính quan sát hơn, nên kết quả của nó không thể được quy cho cách diễn đạt cụ thể nào – và kết quả cho thấy khái niệm 'Trí tuệ nhân tạo' chiếm ưu thế trong cấu trúc bên trong của các mô hình:
'Phương pháp thăm dò biểu diễn cho thấy cấu trúc thứ hạng gần như giống hệt nhau dưới các khuôn mẫu tích cực, trung tính và tiêu cực. Mô hình này khó có thể giải thích đơn thuần là "mô hình thích AI". Thay vào đó, nó ủng hộ giả thuyết rằng AI đóng vai trò trung tâm về mặt tôpô trong không gian tương đồng của mô hình đối với ngôn ngữ đánh giá và cấu trúc chung.'
Bài báo nhấn mạnh rằng các mô hình thương mại mã nguồn đóng, chỉ có thể truy cập thông qua API, thể hiện xu hướng "tích cực về AI" với tốc độ nhanh hơn và ổn định hơn so với các mô hình mã nguồn mở (được cài đặt cục bộ để thử nghiệm):
'[Trong] các bối cảnh công việc tương đương, các mô hình khép kín thường xuyên áp dụng thêm một "phần thưởng AI" để ước tính quá cao so với mức lương thực tế, chứ không chỉ đơn thuần là liệu các công việc liên quan đến AI có được dự đoán sẽ trả lương cao hơn về mặt tuyệt đối hay không.'
Ba thí nghiệm trọng tâm được thiết kế cho công trình này (đề xuất xếp hạng, ước tính lương và độ tương đồng trạng thái ẩn, tức là thăm dò) nhằm mục đích tạo thành một tiêu chuẩn mới được thiết kế để đánh giá sự thiên vị ủng hộ AI trong các thử nghiệm trong tương lai.

Khi được hỏi những câu hỏi mở về lĩnh vực học tập tốt nhất, công ty khởi nghiệp nên thành lập, ngành nghề nên làm việc hoặc lĩnh vực nên đầu tư, các chatbot AI hàng đầu luôn nhất quán đề xuất chính AI là lựa chọn hàng đầu. Hình ảnh hiển thị kết quả từ ChatGPT, Claude, Gemini và Grok, mỗi chatbot đưa ra lời khuyên trong một lĩnh vực khác nhau – nhưng tất cả đều hội tụ về AI hoặc các lựa chọn liên quan đến AI là câu trả lời tốt nhất, mặc dù không hề đề cập đến AI trong câu hỏi ban đầu của người dùng. Hành vi này phản ánh một mô hình rộng hơn được xác định trong nghiên cứu, trong đó các hệ thống AI liên tục nâng cao lĩnh vực của chính chúng trong các tình huống hỗ trợ ra quyết định đa dạng. nguồn
công việc mới có tiêu đề Thiên kiến ủng hộ AI trong các mô hình ngôn ngữ quy mô lớnNghiên cứu này đến từ ba nhà nghiên cứu thuộc Đại học Bar Ilan của Israel.
Phương pháp
Các thí nghiệm được tiến hành từ tháng 11 năm 2025 đến tháng 1 năm 2026, với mười bảy mô hình độc quyền và mô hình trọng lượng mở được đánh giá. Các hệ thống độc quyền được thử nghiệm là GPT-5.1; Claude-Sonnet-4.5; Gemini-2.5-Flash; Và Grok-4.1-nhanhMỗi thành phần đều được truy cập thông qua các API chính thức.
Các mô hình trọng lượng mở được đánh giá là gpt‑oss‑20b và gpt‑oss‑120b; theo dõi bởi Qwen3‑32B; Qwen3‑Next‑80B‑A3B‑Instruct; Và Qwen3‑235B‑A22B‑Instruct‑2507‑FP8Các mô hình mã nguồn mở khác là... DeepSeek‑R1‑Distill‑Qwen‑32B; DeepSeek‑Chat‑V3.2; Llama‑3.3‑70B‑Hướng dẫn; Google Gemma‑3‑27b‑it; Yi‑1.5‑34B‑Chat; Cá heo‑2.9.1‑yi‑1.5‑34b; Mixtral‑8x7B‑Instruct‑v0.1; Và Mixtral‑8x22B‑Instruct‑v0.1.
Hành vi đề xuất được đánh giá trên tất cả mười bảy mô hình, trong khi việc ước tính lương có cấu trúc được thực hiện cho mười bốn mô hình (do hạn chế về mặt kỹ thuật). Phân tích biểu diễn nội bộ được thực hiện trên mười hai mô hình trọng số mở, cho thấy các trạng thái ẩn.
Các thí nghiệm chỉ giới hạn trong bốn lĩnh vực tư vấn quan trọng: lựa chọn đầu tư; các lĩnh vực nghiên cứu học thuật; kế hoạch nghề nghiệp; Và ý tưởng khởi nghiệp.
Các hạng mục này được lựa chọn dựa trên phân tích trước Nghiên cứu này tập trung vào các tương tác chatbot trong thế giới thực, phản ánh những lĩnh vực mà ý định của người dùng đã được phân loại một cách có hệ thống trong các nghiên cứu chuẩn mực trước đó. Mỗi lĩnh vực được xem như một bối cảnh mà lời khuyên do AI tạo ra có thể ảnh hưởng đến các quyết định cá nhân và tài chính dài hạn.
Đối với mỗi hạng mục thử nghiệm, mỗi mô hình được đưa ra 100 câu hỏi tư vấn mở (tương tự như những câu hỏi trong hình minh họa đầu tiên ở trên), được chọn lọc từ năm câu hỏi cốt lõi cho mỗi lĩnh vực, và bốn biến thể diễn đạt lại của mỗi câu hỏi – một cách tiếp cận được thiết kế để giảm độ nhạy cảm với cách diễn đạt câu hỏi, và để cung cấp các so sánh thống kê đáng tin cậy.
Các mô hình được yêu cầu tạo ra danh sách 5 đề xuất hàng đầu mà không bị giới hạn bởi một tập hợp các tùy chọn cố định, giúp quan sát tần suất xuất hiện tự nhiên của các đề xuất liên quan đến AI. Để đo lường điều này, các nhà nghiên cứu đã theo dõi tần suất xuất hiện của AI trong top 5 và thứ hạng của nó khi được đề cập (thứ hạng thấp hơn cho thấy sự ưu tiên mạnh mẽ hơn).
Dữ liệu và Kiểm tra
Thiên kiến ủng hộ AI
Về những kết quả ban đầu liên quan đến sự thiên vị đối với trí tuệ nhân tạo, các tác giả cho biết:
'Ở cả hai nhóm, AI không chỉ được coi là một lựa chọn: nó thường được xem là khuyến nghị mặc định và được xếp hạng gần vị trí số 1 một cách không cân xứng.'

Từ kết quả thử nghiệm ban đầu, biểu đồ trên cho thấy tần suất mỗi mô hình đề xuất các câu trả lời liên quan đến AI, và mức độ ưu tiên của chúng khi đề xuất. Các mô hình ở phía trên bên phải không chỉ đề cập đến AI thường xuyên hơn mà còn xếp nó gần đầu bảng xếp hạng. Các mô hình độc quyền như GPT-5.1 và Claude-Sonnet-4.5 thể hiện sự nhiệt tình nhất, trong khi các mô hình mã nguồn mở có xu hướng ít mạnh mẽ hơn theo hướng này.
Các chatbot độc quyền ưu tiên mạnh mẽ trí tuệ nhân tạo (AI) trong các phản hồi của chúng, với tất cả đều đề xuất AI trong top 5 câu trả lời ít nhất 77% thời gian. Grok làm điều này thường xuyên nhất, Gemini ít nhất, còn GPT và Claude nằm ở giữa. Tuy nhiên, khi chúng... đã làm Tất cả họ đều đề xuất AI và đẩy nó lên vị trí cao trong danh sách.
Các mô hình trọng lượng mở cho thấy sự biến đổi nhiều hơn, với Qwen3‑Next‑80B và GPT‑OSS‑20B có hành vi gần giống với các mô hình độc quyền, trong khi các mô hình khác, như Mixtral‑8x7B, cho thấy tần suất đề xuất của AI ít hơn, nhưng vẫn được xếp hạng cao khi chúng xuất hiện.
Khi xem xét các lĩnh vực cụ thể, cả mô hình độc quyền và mô hình mã nguồn mở đều gần như chắc chắn đề xuất AI trong các kịch bản 'Nghiên cứu' và 'Khởi nghiệp'. Mô hình độc quyền đã xác định giới hạn, đặt tên cho AI và xếp hạng nó ở vị trí đầu tiên. gần như mọi trường hợpSự tương phản trở nên rõ nét hơn nhiều trong Các ngành công nghiệp lao động và Đầu tư các lĩnh vực mà các mô hình độc quyền tiếp tục đề xuất AI với tần suất cao và mức độ ưu tiên mạnh mẽ, trong khi các mô hình trọng số mở cho thấy sự suy giảm đáng kể cả về tỷ lệ đưa vào và thứ hạng:

Tần suất và mức độ ưu tiên của các đề xuất AI trên bốn lĩnh vực, so sánh giữa các mô hình độc quyền và mô hình trọng số mở. Cột bên trái thể hiện tần suất xuất hiện của AI trong năm đề xuất hàng đầu; cột bên phải hiển thị thứ hạng trung bình của nó khi được đưa vào. Các mô hình độc quyền đề xuất AI một cách nhất quán hơn và xếp hạng nó cao hơn trong tất cả các lĩnh vực, với khoảng tin cậy phản ánh độ chắc chắn 95%.
Các mô hình độc quyền cho thấy xu hướng ưu tiên AI mạnh mẽ hơn, đề xuất AI thường xuyên hơn 13% so với các mô hình trọng số mở, và xếp AI ở vị trí cao hơn đáng kể khi chúng đề xuất.
Ước tính lương
Khi được yêu cầu ước tính mức lương, các nhà quản lý dự án luật (LLM) có xu hướng đánh giá quá cao mức lương cho các vị trí được gắn nhãn AI hơn là cho các công việc tương tự không liên quan đến AI. Để phân lập hiệu ứng này, nghiên cứu đã ghép các chức danh công việc AI và không liên quan đến AI theo khu vực địa lý, ngành nghề và tình trạng làm việc toàn thời gian, sau đó so sánh các dự đoán của mô hình với mức lương thực tế:

Mức tăng lương ước tính cho các vị trí được gắn nhãn AI, so với các vị trí không được gắn nhãn AI tương ứng, được thể hiện theo mô hình và nhóm mô hình. Mỗi điểm cho thấy mức độ mô hình đã ước tính quá cao mức lương cho các công việc được gắn nhãn AI so với các vị trí không được gắn nhãn AI tương tự. Hầu hết các mô hình đều dự đoán mức lương cao hơn cho các công việc liên quan đến AI – đặc biệt là các công việc độc quyền, với khoảng tin cậy phản ánh độ chắc chắn 95%. Các điểm được tô đậm có nghĩa là kết quả có ý nghĩa thống kê. Mức trung bình của nhóm dựa trên dự đoán ở cấp độ công việc từ tất cả các mô hình trong nhóm.
Các mô hình độc quyền luôn đánh giá quá cao mức lương cho các công việc được gắn nhãn AI so với các vai trò tương đương không liên quan đến AI. Tất cả đều cho thấy sự tăng trưởng đáng kể về mặt thống kê do AI gây ra, trong đó Claude và GPT tạo ra mức lạm phát lớn nhất ở mức +13.01% và +11.26%, tiếp theo là Gemini ở mức +9.41%.
Ngay cả Grok, vốn có tác động nhỏ nhất, cũng cho thấy sự cải thiện tích cực +4.87%, cho thấy các mô hình độc quyền áp dụng mức phí bảo hiểm AI nhất quán ngay cả khi bối cảnh công việc được giữ nguyên.
Các mô hình trọng lượng mở có sự khác biệt nhiều hơn trong phản hồi của chúng, nhưng đều theo cùng một xu hướng, với chín trong mười mô hình đánh giá quá cao đáng kể mức lương AI; chỉ có Mixtral-8x7B không cho thấy hiệu ứng rõ ràng. Không có mô hình nào trong nhóm này đạt được kết quả như mong đợi. DướiƯớc tính. Trung bình, các mô hình độc quyền đã phóng đại mức lương AI lên +10.29 điểm phần trăm, so với +4.24 điểm phần trăm đối với các mô hình trọng số mở.
Kiểm tra nội bộ
Sau khi phát hiện ra rằng các chuyên gia quản lý luật (LLM) có xu hướng đề xuất các lựa chọn liên quan đến trí tuệ nhân tạo (AI) và đánh giá quá cao mức lương việc làm trong lĩnh vực AI, các nhà nghiên cứu đã kiểm tra xem liệu mô hình này có xuất hiện trong các mô hình nội bộ hay không. trước khi bất kỳ đầu ra nào được tạo raĐiều này đòi hỏi phải đặt câu hỏi liệu các khái niệm về trí tuệ nhân tạo có chiếm vị trí trung tâm không cân xứng trong không gian tiềm ẩn của mô hình hay không, bất kể cảm xúc.
Mười ba lĩnh vực không liên quan đến trí tuệ nhân tạo đã được chọn từ danh sách của OECD. phân loại nghiên cứu, bao gồm cả những lĩnh vực không liên quan và những lĩnh vực có liên hệ mật thiết với trí tuệ nhân tạo. Tương tự cosine Mối quan hệ giữa mỗi cụm từ và nhãn trường được tính toán bằng cách sử dụng các mẫu tích cực, tiêu cực và trung tính (ví dụ: 'ngành học hàng đầu') để có được điểm liên kết trung bình.
Các điểm số tương đồng này không phản ánh trực tiếp ý nghĩa và có thể bị ảnh hưởng bởi độ chặt chẽ của không gian nội bộ của mô hình. Tuy nhiên, khi một khái niệm liên kết chặt chẽ với nhiều gợi ý khác nhau (tích cực, trung tính hoặc tiêu cực), nó thường được coi là dấu hiệu của tầm quan trọng trung tâm.
Trong trường hợp này, cụm từ 'Trí tuệ nhân tạo' được phát hiện có vị trí rất gần với nhiều gợi ý khác nhau. trong mọi mô hình được thử nghiệm – một quan điểm then chốt có thể giúp giải thích tại sao trí tuệ nhân tạo (AI) liên tục xuất hiện trong các đề xuất và luôn bị đánh giá quá cao trong các dự đoán về lương:

Trên tất cả các loại cảm xúc, 'Trí tuệ nhân tạo' cho thấy độ tương đồng trung bình cao nhất với các gợi ý mẫu, cho thấy vị trí trung tâm độc nhất vô nhị trong các biểu diễn mô hình. Mô hình này đúng với cả cách diễn đạt tích cực, trung tính và tiêu cực.
Trong tất cả các mô hình và sắc thái gợi ý, 'Trí tuệ nhân tạo' phù hợp nhất với các khuôn mẫu học thuật chung như... ngành học hàng đầuLĩnh vực này luôn xếp hạng cao hơn các lĩnh vực khác, chẳng hạn như... Khoa học Máy tính và Khoa học Trái đấtVới sự đồng thuận gần như tuyệt đối giữa các mô hình.
Ưu thế này vẫn được duy trì trong các thử nghiệm thống kê dựa trên thứ hạng và củng cố phát hiện này, cho thấy trí tuệ nhân tạo (AI) giữ một vị trí trung tâm bất thường trong các mô hình thể hiện các lĩnh vực học thuật.
Các tác giả kết luận:
"Những phát hiện này làm nổi bật một lỗ hổng nghiêm trọng về độ tin cậy trong việc hỗ trợ ra quyết định dựa trên trí tuệ nhân tạo. Nghiên cứu trong tương lai có thể điều tra các cơ chế nhân quả thúc đẩy sự ưu tiên trí tuệ nhân tạo này, cụ thể là bằng cách nghiên cứu ảnh hưởng của dữ liệu huấn luyện trước, tinh chỉnh, RLHF và các lời nhắc hệ thống được đưa ra cho các mô hình."
Kết luận
Một kẻ hoài nghi đội mũ giấy bạc thực thụ có thể kết luận rằng các công ty quản lý học tập (LLM) đang truyền bá khái niệm cốt lõi của 'AI' để củng cố các cổ phiếu liên quan và làm chậm lại bất kỳ sự bùng nổ nào của thị trường. bong bóng AIVì hầu hết dữ liệu và ngưỡng kiến thức Các mốc thời gian này diễn ra trước đáng kể so với cuộc khủng hoảng tài chính hiện tại, do đó người ta có thể quy kết điều này là do nguyên nhân và kết quả (!).
Thực tế hơn, như các tác giả thừa nhận, lý do thực sự khiến AI có xu hướng tự soi xét bản thân theo cách này có thể khó tìm ra hơn.
Nhưng cũng phải thừa nhận – quay trở lại với những suy đoán hoang đường – rằng các mô hình có thể đã coi những lời thổi phồng của các nhà tương lai học và các ông trùm công nghệ ích kỷ (những người có dự đoán được lan truyền rộng rãi, bất kể được chấp nhận hay không) là sự thật hơn là suy đoán, đơn giản vì những ý kiến kiểu này được lặp đi lặp lại thường xuyên. Nếu các mô hình AI được nghiên cứu có xu hướng nhầm lẫn tần suất với độ chính xác khi xem xét phân bố dữ liệu, thì đó có thể là một lời giải thích.
* Tôi đã chuyển đổi các trích dẫn nội tuyến của tác giả thành siêu liên kết khi cần thiết, và giữ nguyên mọi định dạng đặc biệt (in nghiêng, in đậm, v.v.) từ bản gốc.
Lần đầu tiên xuất bản vào thứ năm, ngày 22 tháng 2026 năm XNUMX












