倫理
Appen 社最高技術責任者 Wilson Pang – インタビュー シリーズ
Wilson Pang は、次の最高技術責任者です。 アペンでは、世界クラスのデータ サイエンティスト、エンジニア、プロダクト マネージャーのグループを率い、テクノロジーと人間の力を組み合わせて AI データの問題を解決しています。
このインタビューでは AI の倫理について話し合います。 Appen の 2020 年 AI および機械学習の現状レポート そして現在の業界の課題。
あなた個人としてソフトウェア エンジニアリングとデータ サイエンスに惹かれたのは何ですか?
10年前にデータとAIに関わる機会をいただきました。 AI の世界では、開発者はもはやコードでロジックを制御するのではなく、データが AI モデルのロジックを決定するのは興味深いことです。 私は IBM で開発者としてキャリアをスタートし、銀行、通信事業者、証券取引会社向けの大規模システムを構築しました。 ソフトウェアとAIの力に興奮しました。
また、データと機械学習がどのようにビジネスの成長に役立つのかを直接見ることができたのも幸運でした。 eBay の私のチームは AI を活用して購入者の購入を増やし、数千万の収益を増やしました。 Trip.com では AI を活用して内部効率を向上させ、運用コストを大幅に削減しました。現在、Appen では、あらゆる業界の企業が AI を使用してビジネスの成功を推進できるよう支援しています。
Appen の AI およびデータ ラベリング製品についていくつか説明していただけますか?
当社は、1 万を超える請負業者と協力して、画像、テキスト、音声、オーディオ、ビデオ、その他のデータを収集してラベルを付けるトレーニング データ プロバイダーです。 これらの請負業者は 130 か国以上に居住し、180 の言語と方言を話すため、AI プロジェクトに高品質のデータを提供することができます。 また、20 年以上 AI データに取り組んできた専門チームもおり、トレーニング データを適切に取得する方法について多くの知識を持っています。 最後に重要なことですが、当社には業界をリードする AI 支援アノテーション プラットフォームがあり、品質と生産性を保証する機能が組み込まれています。 当社の顧客は、当社がチームと提携するマネージド サービス ソリューション、またはセルフサービス プラットフォームのいずれかを選択できます。 当社の AI 支援データ アノテーション プラットフォームにより、お客様は機械学習支援ツールとともにプロジェクトを管理して、品質、精度、アノテーション速度を向上させることができます。
20 年以上の経験を持つ当社のサービスは、世界クラスのトレーニング データ、最先端の AI 支援データ アノテーション プラットフォーム、および高品質のデータを確保するための世界中の多様なクラウドを提供します。
利用可能なオープンソース データ セットにはどのようなものがありますか?
Appen には、画像注釈から手書き認識まで、オンラインで利用できるオープンソース データ セットがいくつかあります。 これらのデータセットは無料でダウンロードでき、AI モデルの構築とトレーニングに使用できます。 利用可能な最も興味深いセットの 21000 つは、医療画像からの核セグメンテーションに関するものです。 このデータには、医療専門家によって注釈が付けられ、検証された XNUMX 個を超える核が含まれています。
個人的に最大の収穫は何ですか? 2020 年 AI および機械学習の現状レポート?
このレポートで最も興味深い発見は、経営幹部の関与が増加したことです。 噂には聞いていましたが、前年比31%増とは驚きでした。 AI はテクノロジー リーダーだけでなく、中核ビジネスの一部になりつつあります。
このレポートにおける懸念の原因の 25 つは、偏りのない AI がミッション クリティカルであると述べた企業はわずか XNUMX% であることです。 これは、AI の偏見を取り除くことの重要性についての教育が不足していることが原因だと思いますか? これらの統計を改善するには何をする必要がありますか?
はい、教育はその統計を改善するための最初のステップです。 偏ったデータに基づいて構築された AI モデルは偏った結果をもたらし、完全に成功することはありません。 ビジネスリーダーは、偏りのないデータを持つことの重要性と、それが導入の成功にどのようにつながるかを学ぶ必要があります。
AI や大規模なデータセットを扱う際に企業が考慮すべき AI 倫理にはどのようなものがありますか?
データの出所を確認することが重要です。 そのデータは倫理的に調達されており、偏りはありませんか? データの出所を調べるときは、人々に公正な賃金が支払われているかどうか、データが多様なグループからのものであるかどうかを知りたいと思うでしょう。 私たちは最近リリースしました クラウド倫理規定 インクルージョン、多様性、公正な賃金、貢献者のコミュニケーションをサポートします。
現在の業界最大の課題は何だと思いますか?
データとデータ管理の欠如は、業界にとって最大の課題です。 チームはデータに関して多くの決定を下す必要があり、多くのチームは何が必要かを認識するのに課題を抱えています。 彼らは、どのようなデータを持っているか、そのデータがどこから来たのか、そしてどのデータがまだ必要なのかを理解する必要があります。 これらすべてのデータ管理は、AI モデルの構築とトレーニングにとって重要です。 データが不足していると、モデルに偏りが生じ、結果として成功しない可能性があります。
Appen は長年にわたって AI および機械学習の現状レポートをリリースしてきました。 最初のレポートが発表されたのはいつですか?この最初のレポート以降に見られた最大の変化は何ですか?
最初のレポートは 2015 年に発表され、私たちが目にした最大の変化は AI プロジェクトの所有権にありました。 最初のレポートには、主に自社の AI を管理するデータ サイエンティストが回答しました。 現在、71% が経営幹部の所有権を表明しています。これは、AI がビジネスにとってより重要になるという観点の大きな変化を示しています。 データ サイエンティストは、データから貴重な洞察を構築するためのリソースの不足から、不明確な目標や非現実的な期待まで、多くの課題にも直面していました。 ただし、データとデータ管理に関する重要な課題の XNUMX つは変わりません。
Appen について他に共有したいことはありますか?
16 月 XNUMX 日には、 現実世界での AI の立ち上げに関する初の仮想円卓会議 Appen.com で。 XNUMX 部構成のシリーズでは、業界をリードする実践者が自身の AI への取り組みに関する個人的な経験と洞察を共有し、他の人が AI への取り組みに向けた進歩を加速できるように光を当てます。 企業が成功するためには、データ、倫理、人材、ライフサイクルに関するいくつかの共通の課題を克服する準備ができている必要があります。 第 XNUMX 版では、一流の専門家を集めて、責任ある AI の作成に参加することが彼らとその組織にとって何を意味するのかを共有します。
インタビューありがとうございました。 読者は以下を読みたいかもしれません Appen の 2020 年 AI および機械学習の現状レポート または訪問する アペン ウェブサイトをご覧ください。