Connect with us

Googleの新しいMeenaチャットボットは、ほとんどすべてのことについて、妥当で具体的な会話を交わすことができる

人工知能

Googleの新しいMeenaチャットボットは、ほとんどすべてのことについて、妥当で具体的な会話を交わすことができる

mm

仮想アシスタントのSiri、Alexa、Google Assistantは、印象的で便利ですが、その会話スキルは、特定のコマンドを受け取って事前に定義された応答を提供することに限定されることが多い。GoogleやAmazonなどの企業は、AIトレーニングと開発の方法を追求してきており、AIチャットボットをより強力で柔軟にし、ユーザーとの会話をより自然な方法で行えるようにしている。 DigitalTrendsの報告によると、Googleは最近、論文を公開し、その新しいチャットボット「Meena」の機能を示した。 研究者のブログ投稿によると、Meenaは、ほとんどすべてのトピックについて、ユーザーとの会話を交わすことができる。

Meenaは、オープンドメインのチャットボットであり、会話の文脈に応じて応答し、入力に適応してより自然な応答を提供する。ほとんどの他のチャットボットは、クローズドドメインであり、特定のアイデアを中心に応答が制限され、特定のタスクを実行することに限定される。

Googleの報告によると、Meenaの柔軟性は、巨大なトレーニングデータセットの結果であった。Meenaは、約40億語のソーシャルメディア会話から抽出された単語でトレーニングされ、最も関連性の高い単語にフィルタリングされた。Googleは、ほとんどのボイスアシスタントで見られる問題に対処しようとした。たとえば、会話のトピックやコマンドが複数のターンにわたって展開される場合、ユーザーがボットの応答後に追加の入力を提供する場合など。これにより、多くのチャットボットは、ユーザーに明確化を求めることができず、解釈できないクエリに対しては、単にウェブ結果に頼ることになる。

この特定の問題に対処するために、Googleの研究者は、アルゴリズムを会話の文脈を追跡するように設計し、特定の回答を生成できるようにした。モデルは、会話で既に述べられた内容を処理するエンコーダーと、文脈に基づいて応答を生成するデコーダーを使用した。モデルは、特定のデータと非特定のデータでトレーニングされた。特定のデータは、前のステートメントに密接に関連する単語である。 Googleの投稿によると

「たとえば、Aが『私はテニスが好きだ』と言った場合、Bが『それは素晴らしい』と応答した場合、発言は『非特定』とマークされるべきである。この応答は、数十の異なるコンテキストで使用できるからである。しかし、Bが『私も、ロジャー・フェデラーが大好き!』と応答した場合、それは『特定』とマークされるべきである。なぜなら、それは現在話し手が話していることと密接に関連しているからである。」

モデルをトレーニングするために使用されたデータセットは、会話の7つの「ターン」で構成されていた。トレーニング中、モデルには26億のパラメータがあり、341 GBのテキストデータをパターンに基づいて調べた。データセットは、OpenAIによって作成された GPT-2モデルをトレーニングするために使用されたデータセットの約8.5倍のサイズであった。

Googleは、Meenaのパフォーマンスを、Sensibleness and Specificity Average(SSA)メトリックで報告した。SSAは、会話の進行中に、特定の関連する応答を返す会話エンティティの能力を量化するために設計されたメトリックである。

SSAスコアは、モデルを固定数のプロンプトに対してテストし、モデルが提供した妥当な応答の数を追跡することで計算される。モデルのスコアは、プロンプトに対する妥当な/特定の応答の割合に基づいて導出される。一般的な応答はペナルティされる。Googleによると、平均的な人間はSSAで約86%のスコアを獲得し、Meenaは79%のスコアを獲得した。もう1つの有名なAIモデルである、Pandora Botsによって作成されたエージェントは、人間のようなコミュニケーションを達成したことを認めて、Loebner Prizeを受賞した。Pandora Botsエージェントは、SSAテストで約56%のスコアを獲得した。

MicrosoftとAmazonも、より柔軟で自然なチャットボットを作成しようとしている。Microsoftは、2年間、チャットボットのマルチターンダイアログを作成しようとしており、Cortanaを改善するために、Semantic Machinesを買収した。Amazonは最近、Alexa Prizeチャレンジを実施し、参加者に、約20分間会話できるボットを設計するよう求めた。

ブログ作家およびプログラマーで、 Machine Learning Deep Learning のトピックを専門としています。Danielは、AIの力を社会のために利用する手助けを他者に与えることを希望しています。