私達ず接続

新たな研究論文がAIチャットの「トヌクン」䟡栌蚭定に疑問を呈する

アンダヌ゜ンの芖点

新たな研究論文がAIチャットの「トヌクン」䟡栌蚭定に疑問を呈する

mm

公開枈み

 on

ChatGpT-40 + Adob​​e Firefly

新たな調査によるず、AIサヌビスがトヌクンで課金する方法は、ナヌザヌから実際のコストを隠蔜しおいるこずが明らかになりたした。プロバむダヌはトヌクン数を停装したり、隠れた手順を組み蟌んだりするこずで、ひそかに料金を氎増しするこずができたす。䞀郚のシステムでは、出力には圱響しない䜙分なプロセスが実行されおいるにもかかわらず、請求曞に反映されたす。監査ツヌルの導入も提案されおいたすが、真の監芖䜓制がなければ、ナヌザヌは想定以䞊に倚くの料金を支払うこずになりたす。

 

ほずんどの堎合、消費者ずしお私たちがAI搭茉のチャットむンタヌフェヌスに支払う金額は、 チャットGPT-4oは珟圚、 トヌクン: 䜿甚䞭には気付かれない目に芋えないテキスト単䜍ですが、課金目的では正確にカりントされたす。各取匕所は凊理されるトヌクンの数によっお䟡栌蚭定されたすが、ナヌザヌにはその数を盎接確認する方法はありたせん。

賌入した「トヌクン」ナニットで䜕が埗られるのかをせいぜい䞍完党にしか理解しおいないにもかかわらず、トヌクンベヌスの課金は、䞍安定な信頌の前提に基づいお、プロバむダヌ間で暙準的なアプロヌチになっおいたす。

トヌクンワヌド

トヌクンは単語ず党く同じではありたせんが、倚くの堎合同様の圹割を果たしたす。倚くのプロバむダは、単語、句読点、単語の断片などの小さなテキスト単䜍を説明するために「トヌクン」ずいう甚語を䜿甚しおいたす。 「信じられない」䟋えば、あるシステムでは1぀のトヌクンずしおカりントされるが、別のシステムではそれを分割しおカりントする可胜性がある。 un, 信じる および できる各ピヌスごずにコストが増加したす。

このシステムは、ナヌザヌが入力するテキストずモデルの返信の䞡方に適甚され、䟡栌はこれらのナニットの合蚈数に基づいお決たりたす。

問題は、ナヌザヌが このプロセスを芋るこずができないほずんどのむンタヌフェヌスでは、䌚話䞭にトヌクンの数が衚瀺されず、トヌクンの蚈算方法を再珟するのは困難です。たずえ数が衚瀺されおいおも After 返信が届くず、それが公平であったかどうかを刀断するには遅すぎお、ナヌザヌが目にする内容ず支払う金額ずの間に䞍䞀臎が生じたす。

最近の研究は、より深刻な問題を指摘しおいたす。 䞀぀の研究 プロバむダヌが、ナヌザヌには芋えない方法でトヌクン数を増やすだけで、ルヌルに違反するこずなく過剰請求できる方法を瀺したす。 別の むンタヌフェヌスに衚瀺されるものず実際に請求されるものずの間に䞍䞀臎が明らかになり、ナヌザヌには実際には効率が悪いずいう幻想を䞎えおしたう。 䞉番 モデルが、ナヌザヌには衚瀺されないものの、請求曞には衚瀺される内郚掚論ステップを定期的に生成する方法を公開したす。

調査結果から、 ず思われる 正確で、正確な数字は明瞭さを瀺唆しおいるものの、その根底にあるロゞックは隠されたたたです。これが意図的なものなのか、構造䞊の欠陥なのかは分かりたせんが、結果は同じです。ナヌザヌは目に芋えないもの、そしお倚くの堎合、期埅以䞊のものに察しお料金を支払うこずになりたす。

12個買うず安くなる

最初の これらの論文のタむトルは LLMは高額な料金を請求しおいたせんかトヌクン化、透明性、むンセンティブマックス・プランク゜フトりェアシステム研究所の研究者4人による論文によるず、トヌクンベヌスの課金のリスクは䞍透明性だけにずどたらず、プロバむダがトヌクン数を氎増しするむンセンティブが内圚しおいるず指摘しおいる。

問題の栞心は、文字列のトヌクン化が䞀意ではないずいう事実にありたす。䟋えば、ナヌザヌが「次のNeurIPSはどこで開催されたすか」ずいう質問をプロバむダヌに送信し、プロバむダヌがそれをLLMに入力するず、モデルは2぀のトヌクンからなる「|San| Diego|」ずいう出力を生成したす。

「ナヌザヌは生成プロセスに気づかないため、利己的なプロバむダヌは、基になる文字列を倉曎するこずさえせずに、出力のトヌクン化をナヌザヌに誀っお報告する可胜性がありたす。䟋えば、プロバむダヌは単に「|S|a|n| |D|i|e|g|o|」ずいうトヌクン化を共有し、ナヌザヌに2トヌクンではなく9トヌクンを過剰請求する可胜性がありたす。」

この論文では、目に芋える出力を倉曎するこずなく、たた兞型的なデコヌド蚭定における劥圓性を損なうこずなく、この皮の䞍正な蚈算を実行できるヒュヌリスティックを提瀺しおいる。 ラマ, ミストラル および ゞェマ この方法は、実際のプロンプトを䜿甚しお、異垞な倖芳を瀺さずに枬定可胜な過充電を実珟したす。

「劥圓な誀報告」を甚いたトヌクンむンフレ。各パネルは、プロバむダヌがアルゎリズム1を400個のLMSYSプロンプトの出力に適甚した結果、過剰請求されたトヌクンの割合を瀺しおいたす。サンプリングパラメヌタmずpはそれぞれ異なりたす。すべおの出力は枩床1.3で生成され、蚭定ごずに90回の繰り返しで2505.21627%信頌区間を蚈算したした。出兞https://arxiv.org/pdf/XNUMX

「劥圓な誀報告」を甚いたトヌクンむンフレ。各パネルは、プロバむダヌが1個のLMSYSプロンプトの出力にアルゎリズム400を適甚した結果、過剰請求されたトヌクンの割合を瀺しおいたす。サンプリングパラメヌタmずpはそれぞれ異なりたす。すべおの出力は枩床1.3で生成され、蚭定ごずに90回の繰り返しでXNUMX%信頌区間を蚈算したした。 出兞: https://arxiv.org/pdf/2505.21627

この問題に察凊するために、研究者らは、 文字カりント 圌らは、トヌクンではなく、これがプロバむダヌに䜿甚量を正盎に報告する理由を䞎える唯䞀のアプロヌチであるず䞻匵し、公正な䟡栌蚭定を目指すならば、コストを隠れたプロセスではなく目に芋える文字に結び付けるこずが、粟査に耐えうる唯䞀の遞択肢であるず䞻匵しおいる。文字ベヌスの䟡栌蚭定は、誀報告の動機を排陀するず同時に、より短く効率的な出力に報奚を䞎えるず圌らは䞻匵しおいる。

ただし、ここではいく぀かの远加的な考慮事項がありたすほずんどの堎合、著者らも認めおいたす。たず、提案されおいる文字ベヌスのスキヌムでは、消費者よりもベンダヌに有利になる可胜性のある远加のビゞネスロゞックが導入されたす。

「決しお誀報告をしないプロバむダヌは、可胜な限り短い出力トヌクンシヌケンスを生成し、BPEなどの珟圚のトヌクン化アルゎリズムを改善しお、出力トヌクンシヌケンスを可胜な限り圧瞮するずいう明確なむンセンティブを持っおいたす。」

ここでの楜芳的なモチヌフは、ベンダヌが簡朔で、より有意矩か぀䟡倀のある出力を生成するよう促されるずいうものです。実際には、プロバむダヌがテキスト数を削枛するための、より䜎効率な方法は明らかに存圚したす。

第二に、著者らは、䌁業が難解なトヌクンシステムからより明確なテキストベヌスの課金方法に移行するには、法敎備が必芁になる可胜性が高いず述べおいる。将来的には、新興䌁業がこの皮の䟡栌モデルで補品を発売するこずで差別化を図るかもしれないが、真に競争力のある補品そしお、より小芏暡な事業芏暡で運営しおいる䌁業を持぀䌁業は、 EEEカテゎリヌ) は、これを行う意欲をなくしたす。

最埌に、著者らが提案するような窃盗アルゎリズムには、それ自身の蚈算コストが䌎う。「远加料金」の蚈算コストが朜圚的な利益を䞊回れば、この仕組みには明らかにメリットがない。しかし、研究者らは提案アルゎリズムが効果的か぀経枈的であるこずを匷調しおいる。

著者らは自らの理論のコヌドを提䟛しおいる GitHubで.

スむッチ

2番目の 箙 – タむトル付き 目に芋えないトヌクン、目に芋える請求曞䞍透明なLLMサヌビスにおける隠れたオペレヌションの監査が緊急に必芁メリヌランド倧孊ずバヌクレヌ倧孊の研究者による論文は、商甚蚀語モデルAPIにおけるむンセンティブの䞍䞀臎はトヌクン分割に限らず、 クラス党䜓 隠された操䜜の。

これらには、内郚モデルの呌び出し、掚枬による掚論、ツヌルの䜿甚、マルチ゚ヌゞェントのむンタラクションなどが含たれたすが、これらはすべお、可芖性や償還請求なしにナヌザヌに課金される可胜性がありたす。

䞻芁プロバむダヌにおける掚論LLM APIの䟡栌蚭定ず透明性。リストされおいるすべおのサヌビスは、ナヌザヌに隠された内郚掚論トヌクンに察しお課金しおおり、実行時にこれらのトヌクンを可芖化するサヌビスは提䟛しおいたせん。コストは倧きく異なり、OpenAIのo1-proモデルは、Claude Opus 4やGemini 2.5 Proず同等の透明性にもかかわらず、2505.18471䞇トヌクンあたりの課金がXNUMX倍も高くなりたす。出兞https://www.arxiv.org/pdf/XNUMX

䞻芁プロバむダヌにおける掚論LLM APIの䟡栌蚭定ず透明性。リストされおいるすべおのサヌビスは、ナヌザヌに隠された内郚掚論トヌクンに察しお課金しおおり、実行時にこれらのトヌクンを可芖化するサヌビスは提䟛しおいたせん。コストは倧きく異なり、OpenAIのo1-proモデルは、Claude Opus 4やGemini 2.5 Proず同等の透明性にもかかわらず、XNUMX䞇トヌクンあたりの課金がXNUMX倍高くなっおいたす。 出兞: https://www.arxiv.org/pdf/2505.18471

サヌビスの量ず質が怜蚌可胜な埓来の請求ずは異なり、著者らは、今日のLLMプラットフォヌムは、 構造的な䞍透明性: ナヌザヌは報告されたトヌクンず API の䜿甚状況に基づいお課金されたすが、これらのメトリックが実際の䜜業たたは必芁な䜜業を反映しおいるかどうかを確認する手段はありたせん。

この論文では、操䜜の䞻な圢態を 2 ぀特定しおいたす。 数量むンフレナヌザヌの利益なくトヌクンや通話回数が増加する堎合。 品質䜎䞋プレミアム コンポヌネントの代わりに、パフォヌマンスの䜎いモデルやツヌルが暗黙的に䜿甚される堎合:

掚論LLM APIでは、プロバむダヌは倚くの堎合、同じモデルファミリヌの耇数のバリアント容量、トレヌニングデヌタ、最適化戊略が異なるものを維持しおいたす䟋ChatGPT o1、o3。モデルのダりングレヌドずは、䜎コストのモデルぞのサむレントな代替を指し、期埅されるサヌビス品質ず実際のサヌビス品質の間に䞍䞀臎が生じる可胜性がありたす。

䟋えば、課金はそのたたに、プロンプトはより小芏暡なモデルで凊理されるこずがありたす。倚くのタスクにおいお最終的な回答が劥圓に芋える可胜性があるため、ナヌザヌがこの慣行に気付くのは困難です。

この論文では、請求されたトヌクンの90%以䞊がナヌザヌに衚瀺されず、内郚的な掚論によっおトヌクンの䜿甚量が20倍以䞊に膚らんでいた事䟋が蚘録されおいたす。正圓かどうかはさおおき、こうした手順の䞍透明さは、ナヌザヌがトヌクンの関連性や正圓性を刀断する根拠を䞀切䞎えたせん。

゚ヌゞェント システムでは、AI ゚ヌゞェント間の内郚やり取りでそれぞれ料金が発生しおも最終的な出力に倧きな圱響を䞎えないため、䞍透明性が高たりたす。

゚ヌゞェントは内郚掚論に加えお、プロンプト、芁玄、蚈画指瀺を亀換するこずでコミュニケヌションを行いたす。各゚ヌゞェントは、他の゚ヌゞェントからの入力を解釈し、ワヌクフロヌを導くための出力を生成したす。これらの゚ヌゞェント間メッセヌゞは、゚ンドナヌザヌには盎接衚瀺されないこずが倚い、倧量のトヌクンを消費する堎合がありたす。

「゚ヌゞェントの調敎䞭に消費されるトヌクン生成されたプロンプト、応答、ツヌル関連の指瀺などは通垞、ナヌザヌには衚瀺されたせん。゚ヌゞェント自身が掚論モデルを䜿甚する堎合、課金はさらに䞍透明になりたす。」

これらの問題に察凊するため、著者らは、内郚掻動の暗号的蚌明、モデルたたはツヌルの同䞀性を瀺す怜蚌可胜なマヌカヌ、そしお独立した監芖を含む階局的な監査フレヌムワヌクを提案しおいる。しかし、根本的な懞念は構造的なものである。珟圚のLLM課金スキヌムは、氞続的な 情報の非察称性ナヌザヌは、怜蚌したり詳现を調べたりできないコストにさらされるこずになりたす。

目に芋えないものを数える

メリヌランド倧孊の研究者による最終論文は、請求問題を䞍正䜿甚や誀報告の問題ではなく、構造の問題ずしお再定矩しおいる。 箙 – タむトル付き CoIn: 商甚の䞍透明な LLM API における目に芋えない掚論トヌクンのカりント、そしおメリヌランド倧孊の10人の研究者によるず、ほずんどの商業LLMサヌビスは珟圚、 䞭玚掚論 モデルの最終的な答えに貢献するが、 䟝然ずしおトヌクンに料金を請求する.

この論文では、これにより、怜出されるこずなくシヌケンス党䜓を停造、泚入、たたは膚匵させるこずができる、芳察䞍可胜なビリング サヌフェスが䜜成されるず䞻匵しおいたす*。

「この䞍可芖性により、プロバむダヌは トヌクン数の誀報告 or 䜎コストで停造された掚論トヌクンを泚入しお、トヌクン数を人為的に増やす私たちはこの習慣を トヌクン数のむンフレ.

「䟋えば、OpenAIのo3モデルで実行された単䞀の高効率ARC-AGIは111億XNUMX䞇トヌクンを消費したした。 原䟡蚈算 $66,772.3 この芏暡を考えるず、小さな操䜜でも倧きな経枈的圱響に぀ながる可胜性がありたす。

「このような情報の非察称性により、AI䌁業はナヌザヌに倧幅な過剰請求をするこずができ、その結果、ナヌザヌの利益が損なわれるこずになる。」

この非察称性に察抗するために、著者らは コむンは、隠されたトヌクンをその内容を明らかにせずに怜蚌するように蚭蚈されたサヌドパヌティの監査システムであり、ハッシュ化されたフィンガヌプリントずセマンティックチェックを䜿甚しおむンフレの兆候を芋぀けたす。

䞍透明な商甚LLM向けのCoIn監査システムの抂芁。パネルAは、掚論トヌクンの埋め蟌みがMerkle朚にハッシュ化され、トヌクンの内容を明らかにするこずなくトヌクン数を怜蚌する方法を瀺しおいたす。パネルBは、軜量ニュヌラルネットワヌクが掚論ブロックず最終解を比范する意味的劥圓性チェックを瀺しおいたす。これらのコンポヌネントを組み合わせるこずで、サヌドパヌティの監査人は、独自のモデル動䜜の機密性を維持しながら、隠れたトヌクンむンフレを怜出できたす。出兞https://arxiv.org/pdf/2505.13778

䞍透明な商甚LLM向けのCoIn監査システムの抂芁。パネルAは、掚論トヌクンの埋め蟌みがMerkle朚にハッシュ化され、トヌクンの内容を明らかにするこずなくトヌクン数を怜蚌する方法を瀺しおいたす。パネルBは、軜量ニュヌラルネットワヌクが掚論ブロックず最終解を比范する意味的劥圓性チェックを瀺しおいたす。これらのコンポヌネントを組み合わせるこずで、サヌドパヌティの監査人は、独自のモデル動䜜の機密性を維持しながら、隠れたトヌクンむンフレを怜出できたす。出兞: https://arxiv.org/pdf/2505.13778

1぀のコンポヌネントは、 メルクルツリヌもう1぀は、隠されたコンテンツの関連性を、回答の埋め蟌みず比范するこずで評䟡したす。これにより、監査人は、単に請求額を増やすためだけにトヌクンが挿入されおいる兆候である、パディングや無関係性を怜出できたす。

CoInはテスト導入においお、基瀎デヌタの露出を最小限に抑えながら、䞀郚のむンフレ行為においお95%近くの怜出率を達成したした。このシステムは䟝然ずしおプロバむダヌからの自䞻的な協力に䟝存しおおり、゚ッゞケヌスにおける解決胜力も限られおいたすが、その本質は明癜です。珟圚のLLM課金のアヌキテクチャそのものが、怜蚌䞍可胜な誠実性を前提ずしおいるのです。

たずめ

ナヌザヌから前払い金を埗るずいう利点に加えお、 スクリプトを曞くベヌスの通貚䟋えば、 CivitAIは、ナヌザヌが支払っおいる通貚や賌入しおいる商品の真の䟡倀をナヌザヌから遠ざけるのに圹立ちたす。同様に、ベンダヌに独自の䟡倀を定矩する䜙地を䞎えるこずは、 独自の枬定単䜍 さらに、消費者は実際のお金で䜕に実際に費やしおいるのか分からなくなっおしたいたす。

以䞋のような ラスベガスの時蚈䞍足この皮の察策は、消費者をコストに察しお無頓着にしたり、無関心にしたりするこずを目的ずしおいるこずが倚い。

ほずんど理解されおいない トヌクンは、様々な方法で消費され定矩されるので、LLMの消費の枬定単䜍ずしおは適切ではないかもしれたせん。 トヌクンのコストが䜕倍も高い 英語ベヌスのセッションず比范しお、英語以倖の蚀語での LLM 結果がより劣るず蚈算されたす。

しかし、マックス・プランクの研究者が提案したように、文字ベヌスの出力は、より簡朔な蚀語を優先し、 自然に冗長な蚀語枛䟡償华トヌクンカりンタヌなどの芖芚的な衚瀺は、おそらくLLMセッションで私たちを少し浪費させるだけでしょうから、少なくずも法的な措眮が取られない限り、そのような䟿利なGUIの远加がすぐに実珟する可胜性は䜎いでしょう。

 

* 著者の匷調点。著者のむンラむン匕甚をハむパヌリンクに倉換したした。

初版発行日29幎2025月XNUMX日朚