Andersonův úhel
AI nemusí poskytovat lepší odpovědi, pokud jste k němu slušní

Veřejné mínění o tom, zda se vyplatí být slušný k umělým inteligencím, se mění téměř tak často, jako se mění poslední verdikt o kávě nebo červeném vínu – jeden měsíc je oslavován, další měsíc je zpochybněn. Přestože je tomu tak, stále více uživatelů nyní přidává slova jako „prosím“ nebo „děkujeme“ ke svým dotazům, nejen ze zvyku nebo obavy, že hrubé výměny by mohly přejít do skutečného života, ale také z přesvědčení, že zdvořilost vede k lepším a produktivnějším výsledkům z umělých inteligencí.
Tento předpoklad se šíří mezi uživateli i výzkumníky, přičemž formulace dotazů je ve výzkumných kruzích studována jako nástroj pro zarovnání, bezpečnost a kontrolu tónu, zatímco zvyky uživatelů posilují a mění tyto očekávání.
Například studie z Japonska z roku 2024 zjistila, že zdvořilost dotazu může změnit, jak se velké jazykové modely chovají, testovala GPT-3.5, GPT-4, PaLM-2 a Claude-2 na anglických, čínských a japonských úkolech a přepsala každý dotaz na tři úrovně zdvořilosti. Autoři této studie zjistili, že „hrubé“ nebo „neslušné“ formulace vedly k nižší faktické přesnosti a kratším odpovědím, zatímco středně zdvořilé žádosti produkovaly jasnější vysvětlení a méně odmítání.
Navíc Microsoft doporučuje zdvořilý tón s Co-Pilotem, z hlediska výkonu rather než kulturního.
Nicméně, nová výzkumná práce z George Washington University zpochybňuje tuto stále populárnější ideu, představuje matematický rámec, který předpovídá, kdy výstup velkého jazykového modelu „kollabuje“, přechází z koherentního na zavádějící nebo dokonce nebezpečný obsah. V tomto kontextu autoři tvrdí, že být zdvořilý nemá významný vliv na zpoždění nebo prevenci tohoto „kollapsu“.
Varování
Výzkumníci argumentují, že zdvořilý jazyk je obecně nesouvisející s hlavním tématem dotazu a proto nemá významný vliv na zaměření modelu. K podpoře tohoto tvrzení předkládají podrobnou formulaci, jak jedna pozornost hlavy aktualizuje svou vnitřní směr, zatímco zpracovává každý nový token, zřejmě demonstruje, že chování modelu je tvarováno kumulativním vlivem obsahu-nosných tokenů.
Jako výsledek, zdvořilý jazyk je považován za mít malý vliv na to, kdy výstup modelu začíná se zhoršovat. To, co určuje „bod zlomu“, uvádí se v článku, je celkové zarovnání významných tokenů s buď dobrými nebo špatnými výstupními cestami – ne přítomnost sociálně zdvořilého jazyka.
… (zbytek obsahu)










