記事執筆
Julien Salinas 氏、NLP Cloud 創設者兼 CTO – インタビュー シリーズ
Julien Salinas は、 NLPクラウド。 NLP クラウド プラットフォームは、NER、感情分析、テキスト分類、要約、質問応答、テキスト生成、翻訳、言語検出、文法およびスペル修正、意図の分類と意味の類似性。
最初にコンピューター サイエンスに興味を持ったきっかけは何ですか?
私はビジネススクールでプログラミングを始めました! 意外に聞こえるかもしれません。 実際、ビジネス自体が退屈で、プロジェクトを達成するための技術的スキルがなければすぐに限界があることにすぐに気づきました。
当時の最初のプロジェクトは音楽教師のための小さなウェブサイトで、次に家族のための別のプロジェクト、そして私は Python の学習を始めました…というように続きました。 現在、私は Python/Go 開発者および DevOps として 15 年間働いています。
NLP クラウドの背後にある誕生のストーリーを教えていただけますか?
それは 2 年前、開発者として機械学習モデルを運用環境に適切にデプロイするのは難しいことに気づいたときに始まりました。
私は、Hugging Face Transformers や spaCy などのフレームワークによる進歩に驚き、プロジェクトで非常に高度な NLP モデルを活用することができました。 しかし、実稼働環境でこれらのモデルを使用するのはまた大変で、驚いたことに、NLP 用の興味深い No-Ops クラウドは市場で見つかりませんでした。
そこで、NLP モデルを展開するための独自のプラットフォームを立ち上げることにしました。 すぐにお客様から素晴らしいフィードバックをいただき、それらのフィードバックに基づいて多くの機能を追加しました (事前トレーニングされたモデル、微調整、プレイグラウンドなど)。
NLP クラウド プラットフォームは、GPT-3 のオープンソース代替 GPT-J をサポートしています。 GPT-Jとは具体的に何ですか?
GPT-Jは今年3月にEleutherAIと呼ばれる研究者チームによってリリースされた。 彼らは、GPT-2 は、その前任者 (GPT および GPT-XNUMX) と同様に、オープンソース モデルであるべきだと考えています。 彼らは、GPT のような強力な AI モデルの悪用の可能性について誰もが懸念すべきであるとしても、これらのモデルをオープンソースにしない理由にはならない、と主張しています。 まったく逆です。彼らは、AI モデルがオープンソースのままであれば、コミュニティがこれらのモデルが内部でどのように機能しているかを理解し、これらのモデルが誤った動作(女性蔑視、女性蔑視、人種差別、…)。
GPT-J は GPT-3 Curie と直接同等であり、両方とも 6 億程度のパラメーターでトレーニングされています。
どちらもほぼ同じ意味で使用できます。
GPT-J が GPT-3 の優れた代替品であるのはなぜですか?
GPT-3 は Microsoft に属しており、ユーザーが GPT-3 を使用する唯一の方法は、公式 GPT-XNUMX API を経由することです。
しかし、この API は非常に高価で、非常に制限が厳しいです。API へのアクセスをリクエストする必要があり、たとえアプリケーションが受け入れられたとしても、ビジネス モデルがガイドラインに準拠していないと判断されれば、いつでもアクセスが遮断される可能性があります。 たとえば、「オープンエンド」テキスト (複数の段落で構成される長いテキスト) はポリシーに反するため、生成できません。
GPT-J にはオープンソースであるため、そのような制限はなく、誰でもインストールして使用できます。
GPT-J を NLP Cloud に統合する際の技術的な課題にはどのようなものがありましたか?
GPT-J はリソース消費量 (RAM、CPU、GPU など) が多いため、インストールが複雑です。 GPU がなくても動作しますが、非常に遅いので実用的ではありません。
結局のところ、GPT-J の実行に必要なハードウェアは非常に高価なので、コストを下げるために多くの実装の詳細に取り組む必要がありました。
また、NLP Cloud 上で GPT-J の高可用性を確保し、本番環境に適したものにするために、GPT-J の冗長性とフェイルオーバー戦略に取り組む必要がありましたが、これは非常に困難な場合があります。
提供されている事前トレーニング済み AI モデルについていくつか説明していただけますか?
私たちは、ユースケースごとに最適な事前トレーニング済み AI モデルを選択するために最善を尽くしています。
テキストの要約の場合、私たちの意見では、Facebook の Bart Large CNN が最適です。非常に優れた結果が得られますが、GPU がないとかなり遅くなる可能性があります。
テキスト分類には、Facebook の Bart Large MNLI (英語分類用) と Joe Davison の XLM Roberta Large XLNI (英語以外の言語用) を実装しました。 どちらも高速で非常に正確です。
質問応答には、Deepset の Roberta Base Squad 2 を使用します。これは高速で正確ですが、より高度な質問応答には GPT-J を使用することをお勧めします。
などなど!
NLP クラウドの最良の使用例にはどのようなものがありますか?
最も使用されていると思われるユースケースは、テキストの要約、テキストの分類、GPT-J によるテキスト生成で、製品説明の生成、言い換え、記事の生成などです。
しかし、お客様のユースケースは非常に多様で、これほど多くの素晴らしいアイデアが出てくるのを見るのは非常に印象的です。
NLP Cloud について他に共有したいことはありますか?
テキスト理解とテキスト生成のための AI が、いよいよ実際の製品や社内ワークフローで「実際に」使用される企業が増えてきているように思えます。
NLP がもはや単なる研究分野ではなく、NLP を活用できる実際のビジネス ユースケースがあることは素晴らしいことです。
NLP Cloud では、本番環境で誰でも簡単に NLP をテストして使用できるように最善を尽くしていきます。
素晴らしいインタビューをありがとうございました。さらに詳しく知りたい読者は、こちらをご覧ください。 NLPクラウド.