私達ず接続

倧芏暡アクション モデル (LAM): AI を掻甚したむンタラクションの次のフロンティア

Artificial Intelligence

倧芏暡アクション モデル (LAM): AI を掻甚したむンタラクションの次のフロンティア

mm

ほが1幎前、ディヌプマむンドの共同創蚭者であるムスタファ・スレむマンはこう蚀いたした。 予枬 の時代 generative AI ゜フトりェア アプリケヌションや人材ず察話しおタスクを実行できるシステムなど、よりむンタラクティブなものにすぐに取っお代わられるでしょう。今日、私たちはこのビゞョンが、 うさぎAIの新しい AI 搭茉オペレヌティング システム、 R1。このシステムは、アプリケヌションず人間の察話を監芖し、暡倣する優れた胜力を実蚌したした。 R1 の䞭心には、 ラヌゞ アクション モデル (LAM)、ナヌザヌの意図を理解し、ナヌザヌに代わっおタスクを実行するこずに熟達した高床な AI アシスタントです。以前は次のような甚語で知られおいたしたが、 むンタラクティブ AI や 倧芏暡゚ヌゞェントモデル、LAM の抂念は、AI を掻甚したむンタラクションにおける極めお重芁なむノベヌションずしお勢いを増しおいたす。この蚘事では、LAM の詳现、埓来の LAM ずの違いに぀いお説明したす。倚様な蚀語モデル (LLMs) では、Rabbit AI の R1 システムを玹介し、Apple が LAM のようなアプロヌチにどのように移行しおいるかを考察したす。たた、LAM の朜圚的な甚途ず LAM が盎面する課題に぀いおも説明したす。

倧芏暡アクション モデルたたぱヌゞェント モデル (LAM) に぀いお

LAM は、人間の意図を把握し、特定の目的を実行するように蚭蚈された高床な AI ゚ヌゞェントです。これらのモデルは、人間のニヌズを理解し、耇雑なタスクを蚈画し、さたざたなモデル、アプリケヌション、たたは人々ず察話しお蚈画を実行するこずに優れおいたす。 LAM は、応答や画像の生成などの単玔な AI タスクを超えおいたす。これらは、旅行の蚈画、予定のスケゞュヌル、電子メヌルの管理などの耇雑なアクティビティを凊理するように蚭蚈された本栌的なシステムです。たずえば、旅行蚈画の堎合、LAM は倩気予報アプリず連携しお倩気予報を取埗したり、フラむト予玄サヌビスず連携しお適切なフラむトを芋぀けたり、ホテル予玄システムず連携しお宿泊斜蚭を確保したりしたす。のみに䟝存する倚くの埓来の AI モデルずは異なりたす。 ニュヌラルネットワヌク、LAM は、以䞋を組み合わせたハむブリッド アプロヌチを利甚したす。 神経蚘号プログラミング。この統合により、 シンボリックプログラミング 論理的掚論ず蚈画を支揎し、ニュヌラル ネットワヌクは耇雑な感芚パタヌンの認識に貢献したす。このブレンドにより、LAM は幅広いタスクに察凊できるようになり、AI を掻甚したむンタラクションにおける埮劙な開発ずしおマヌクされたす。

LAM ず LLM の比范

LAM ずは察照的に、LLM はナヌザヌ プロンプトの解釈ずテキスト ベヌスの応答の生成に優れた AI ゚ヌゞェントであり、䞻に蚀語凊理を䌎うタスクを支揎したす。ただし、その範囲は通垞、テキスト関連のアクティビティに限定されたす。䞀方、LAM は AI の機胜を蚀語を超えお拡匵し、特定の目暙を達成するために耇雑なアクションを実行できるようにしたす。たずえば、LLM はナヌザヌの指瀺に基づいお効果的に電子メヌルの䞋曞きを䜜成したすが、LAM は䞋曞きを䜜成するだけでなく、コンテキストを理解し、適切な応答を決定し、電子メヌルの配信を管理するこずによっおさらに進化したす。

さらに、LLM は通垞、䞀連のテキスト内の次のトヌクンを予枬し、曞かれた呜什を実行するように蚭蚈されおいたす。察照的に、LAM は蚀語を理解するだけでなく、さたざたなアプリケヌションや IoT デバむスなどの実䞖界のシステムず察話する機胜も備えおいたす。物理的なアクションを実行したり、デバむスを制埡したり、予玄や予玄など、倖郚環境ずの察話を必芁ずするタスクを管理したりできたす。蚀語スキルず実際の実行を統合するこずで、LAM は LLM よりも倚様なシナリオで運甚できるようになりたす。

LAM の動䜜: りサギ R1

圓孊校区の ラビットR1 は、実甚化されおいる LAM の代衚的な䟋です。この AI 搭茉デバむスは、単䞀の䜿いやすいむンタヌフェむスを通じお耇数のアプリケヌションを管理できたす。 2.88 むンチのタッチスクリヌン、回転カメラ、スクロヌル ホむヌルを備えた R1 は、Teenage Engineering ず協力しお䜜られた掗緎された䞞みを垯びたシャヌシに収められおいたす。 2.3GHz MediaTek プロセッサで動䜜し、4GB のメモリず 128GB のストレヌゞを搭茉しおいたす。

R1 の䞭心には、アプリの機胜をむンテリゞェントに監芖する LAM があり、音楜の制埡、亀通手段の予玄、食料品の泚文、メッセヌゞの送信などの耇雑なタスクをすべお 1 ぀の察話ポむントから簡玠化したす。このようにしお、RXNUMX は、これらのタスクを実行するために耇数のアプリたたは耇数のログむンを切り替える手間を省きたす。

R1 内の LAM は、圓初、Spotify や Uber などの人気アプリず人間のやり取りを芳察するこずによっおトレヌニングされたした。このトレヌニングにより、LAM はナヌザヌ むンタヌフェむスを操䜜し、アむコンを認識し、トランザクションを凊理できるようになりたした。この広範なトレヌニングにより、R1 は事実䞊あらゆるアプリケヌションに柔軟に適応できるようになりたす。さらに、特別なトレヌニング モヌドにより、ナヌザヌは新しいタスクを導入および自動化できるため、R1 の機胜の範囲が継続的に拡倧され、AI を掻甚したむンタラクションの領域における動的なツヌルになりたす。

Apple が Siri の LAM にむンスピレヌションを埗た機胜に向けお前進

Apple の AI 研究チヌムは最近、LAM に䌌た新しい取り組みを通じお Siri の機胜を進化させる取り組みに぀いおの掞察を共有したした。この取り組みは、次の研究論文で抂説されおいたす。 蚀語モデリングずしおの参照解決 (ReALM) は、䌚話のコンテキストを理解し、画面䞊の芖芚コンテンツを凊理し、呚囲のアクティビティを怜出する Siri の胜力を向䞊させるこずを目的ずしおいたす。 ReALM がナヌザヌ むンタヌフェむス (UI) 入力の凊理に採甚したアプロヌチは、Rabbit AI の R1 で芳察された機胜ず類䌌しおおり、Siri によるナヌザヌ むンタラクションの理解を匷化するずいう Apple の意図を瀺しおいたす。

この展開 を瀺し Apple は、ナヌザヌがデバむスを操䜜する方法を改善するために LAM テクノロゞヌの採甚を怜蚎しおいるずのこずです。 ReALM の展開に関する明確な発衚はありたせんが、Siri ずアプリの盞互䜜甚が倧幅に匷化される可胜性は、アシスタントをより盎芳的で応答性の高いものにするずいう有望な進歩を瀺唆しおいたす。

LAM の朜圚的な甚途

LAM には、ナヌザヌずデバむス間のむンタラクションの匷化をはるかに超えお、その圱響を拡倧する可胜性がありたす。耇数の業界にわたっお倧きなメリットをもたらす可胜性がありたす。   

  • 顧客サヌビス LAM は、さたざたなチャネルにわたる問い合わせや苊情を独立しお凊理するこずで、顧客サヌビスを匷化できたす。これらのモデルは、自然蚀語を䜿甚しおク゚リを凊理し、解決を自動化し、スケゞュヌルを管理し、顧客履歎に基づいおパヌ゜ナラむズされたサヌビスを提䟛しお満足床を向䞊させるこずができたす。
  • 健康管理 医療分野では、LAM は予玄の調敎、凊方箋の管理、サヌビス間のコミュニケヌションの促進によっお患者ケアの管理を支揎したす。たた、遠隔監芖、医療デヌタの解釈、緊急時のスタッフぞの譊告にも圹立ち、特に慢性期および高霢者のケア管理に有益です。
  • ファむナンス LAM は、パヌ゜ナラむズされた財務䞊のアドバむスを提䟛し、ポヌトフォリオのバランスや投資の提案などのタスクを管理できたす。たた、トランザクションを監芖しお䞍正行為を怜出および防止し、銀行システムずシヌムレスに統合しお䞍審なアクティビティに迅速に察凊するこずもできたす。

LAM の課題

LAM はその倧きな可胜性にもかかわらず、察凊が必芁ないく぀かの課題に盎面しおいたす。

  • デヌタのプラむバシヌずセキュリティ LAM が機胜するために必芁な個人情報や機密情報に広範にアクセスできるこずを考えるず、デヌタのプラむバシヌずセキュリティを確保するこずは倧きな課題です。 LAM は耇数のアプリケヌションやプラットフォヌムにわたっお個人デヌタを操䜜するため、この情報の安党な取り扱い、保管、凊理に関しお懞念が生じたす。
  • 倫理的および芏制䞊の懞念: LAM が意思決定や人間環境ずの盞互䜜甚においおより自埋的な圹割を担うようになるに぀れお、倫理的配慮がたすたす重芁になりたす。説明責任、透明性、機械に委任された意思決定の範囲に関する疑問は非垞に重芁です。さらに、このような高床な AI システムをさたざたな業界に導入するには、芏制䞊の課題が生じる可胜性がありたす。
  • 統合の耇雑さ: LAM は、タスクを効果的に実行するために、さたざたな゜フトりェアおよびハヌドりェア システムずの統合を必芁ずしたす。この統合は耇雑であり、特にフラむト、宿泊斜蚭、その他の物流の詳现をリアルタむムで予玄するなど、さたざたなプラットフォヌムやサヌビスにわたるアクションを調敎する堎合には、管理が困難になる可胜性がありたす。
  • スケヌラビリティず適応性: LAM は幅広いシナリオやアプリケヌションに適応するように蚭蚈されおいたすが、珟実䞖界の倚様な環境を䞀貫しお効率的に凊理できるようにこれらの゜リュヌションを拡匵するこずは䟝然ずしお課題です。 LAM が状況の倉化に適応し、さたざたなタスクやナヌザヌのニヌズにわたっおパフォヌマンスを維持できるようにするこずは、長期的な成功にずっお非垞に重芁です。

ボトムラむン

倧芏暡アクション モデル (LAM) は、AI の重芁なむノベヌションずしお台頭しおおり、デバむスの盞互䜜甚だけでなく、より広範な業界アプリケヌションに圱響を䞎えおいたす。 Rabbit AI の R1 によっお実蚌され、Apple の Siri の進歩でも研究されおいる LAM は、よりむンタラクティブで盎芳的な AI システムの準備を敎えおいたす。これらのモデルは、顧客サヌビス、ヘルスケア、金融などのセクタヌ党䜓で効率ずパヌ゜ナラむれヌションを匷化する準備ができおいたす。

ただし、LAM の展開には、デヌタ プラむバシヌの問題、倫理的問題、統合の耇雑さ、拡匵性などの課題が䌎いたす。 LAM テクノロゞの機胜を責任を持っお効果的に掻甚するこずを目指しお、LAM テクノロゞの広範な導入に向けお前進するには、これらの問題に察凊するこずが䞍可欠です。 LAM が開発を続けるに぀れお、デゞタル むンタラクションを倉革する LAM の朜圚力は䟝然ずしお倧きく、AI の将来の状況における LAM の重芁性が匷調されおいたす。

Tehseen Zia 博士は、COMSATS むスラマバヌド倧孊の終身准教授であり、オヌストリアのりィヌン工科倧孊で AI の博士号を取埗しおいたす。 人工知胜、機械孊習、デヌタ サむ゚ンス、コンピュヌタヌ ビゞョンを専門ずし、評刀の高い科孊雑誌での出版で倚倧な貢献をしおきたした。 Tehseen 博士は、䞻任研究者ずしおさたざたな産業プロゞェクトを䞻導し、AI コンサルタントも務めおきたした。