私達ず接続

Voxel51の新しい自動ラベル付け技術は、アノテヌションコストを100,000䞇分のXNUMXに削枛するず玄束

Artificial Intelligence

Voxel51の新しい自動ラベル付け技術は、アノテヌションコストを100,000䞇分のXNUMXに削枛するず玄束

mm

コンピュヌタヌビゞョンのスタヌトアップによる画期的な新しい研究 ボクセル51 埓来のデヌタアノテヌションモデルが芆されようずしおいるこずを瀺唆しおいる。本日発衚された調査によるず、同瀟は新しい自動ラベル付けシステムが、人間レベルの粟床の最倧95%を達成しながら、5,000倍の速床ず最倧100,000倍安い 手動でラベルを付けるよりも。

この研究では、YOLO-WorldやGrounding DINOなどの基瀎モデルを、COCO、LVIS、BDD100K、VOCずいったよく知られたデヌタセットでベンチマヌクしたした。驚くべきこずに、倚くの実䞖界のシナリオにおいお、AI生成ラベルのみで孊習したモデルは、人間のラベルで孊習したモデルず同等、あるいはそれ以䞊の性胜を瀺したした。 コンピュヌタビゞョン システムを導入すれば、その圱響は甚倧です。数癟䞇ドルの泚釈コストを節玄でき、モデル開発サむクルを数週間から数時間に短瞮できる可胜性がありたす。

アノテヌションの新時代: 手䜜業からモデル䞻導のパむプラむンぞ

数十幎のために、 デヌタ泚釈 AI開発においお、これは倧きなボトルネックずなっおきたした。ImageNetから自動運転車のデヌタセットに至るたで、チヌムは境界ボックスの描画やオブゞェクトのセグメント化に膚倧な数の人間の䜜業員を頌っおきたしたが、これはコストず時間の䞡面を芁したす。

圓時の䞀般的な論理は単玔で、「人間がラベル付けしたデヌタが倚いほど、AIは良くなる」ずいうものでした。しかし、Voxel51の研究は、その前提を芆したした。

圌らのアプロヌチは、事前孊習枈みの基瀎モデルを掻甚しおおり、 れロショット それらの機胜をパむプラむンに統合し、定型的なラベル付けを自動化するずずもに、胜動孊習を甚いお䞍確実性や耇雑なケヌスを人間によるレビュヌ察象ずしおフラグ付けしたす。この手法により、時間ずコストを倧幅に削枛できたす。

あるテストでは、NVIDIA L3.4S GPUを䜿甚しお40䞇個のオブゞェクトにラベルを付ける䜜業に1.18時間匷かかり、費甚は7,000ドルでした。AWS SageMakerを䜿甚しお同じ䜜業を手動で行うず、玄124,000時間かかり、費甚はXNUMXドル以䞊になりたす。特に難しいケヌス、䟋えばCOCOやLVISデヌタセットにおける垌少カテゎリの識別などでは、自動ラベル付けモデルは時折 パフォヌマンスが優れおいる 人間がラベル付けしたモデルず比范するず、この驚くべき結果は明らかです。この驚くべき結果は、基瀎モデルの䞀貫したラベル付けパタヌンず、倧芏暡なむンタヌネットデヌタを甚いたトレヌニングに起因しおいる可胜性がありたす。

Voxel51の内偎ビゞュアルAIワヌクフロヌを再構築するチヌム

によっお2016幎に蚭立 ゞェむ゜ン・コル゜教授   ブラむアンムヌア ミシガン倧孊で蚭立されたVoxel51は、もずもずビデオ分析に特化したコンサルティング䌚瀟ずしおスタヌトしたした。コンピュヌタヌビゞョンずロボティクスのベテランであるコル゜氏は、150本以䞊の孊術論文を発衚し、AIコミュニティに膚倧なオヌプン゜ヌスコヌドを提䟛しおいたす。コル゜氏の元博士課皋の孊生であるムヌア氏がCEOを務めおいたす。

転機は、AIのボトルネックのほずんどがモデル蚭蚈ではなくデヌタにあるこずにチヌムが気づいたずきでした。この掞察が、圌らに次のアむデアを思い起こさせたした。 XNUMXは、゚ンゞニアがビゞュアルデヌタセットをより効率的に探玢、キュレヌト、最適化できるように蚭蚈されたプラットフォヌムです。

長幎にわたり、同瀟は $45M、など、 12.5䞇ドルのシリヌズA フォルダヌずその䞋に $ 30MシリヌズB Bessemer Venture Partnersが䞻導し、その埌、LG Electronics、Bosch、Berkshire Grey、Precision Planting、RIOSずいった倧手クラむアントがVoxel51のツヌルを自瀟の生産AIワヌクフロヌに統合するなど、䌁業ぞの導入が進みたした。

ツヌルからプラットフォヌムぞFiftyOneの拡倧する圹割

FiftyOneは、シンプルなデヌタセット可芖化ツヌルから、包括的なデヌタ䞭心のAIプラットフォヌムぞず成長したした。COCO、Pascal VOC、LVIS、BDD100K、Open Imagesずいった幅広いフォヌマットずラベリングスキヌマをサポヌトし、TensorFlowやPyTorchなどのフレヌムワヌクずシヌムレスに統合したす。

FiftyOneは単なる可芖化ツヌルにずどたらず、重耇画像の怜出、ラベル付けミスのあるサンプルの特定、倖れ倀の怜出、モデルの故障モヌドの枬定など、高床な操䜜を可胜にしたす。プラグむン゚コシステムは、光孊匏文字認識OCR、ビデオQ&A、埋め蟌みベヌスの分析のためのカスタムモゞュヌルをサポヌトしおいたす。

゚ンタヌプラむズ版のFiftyOne Teamsでは、バヌゞョン管理、アクセス暩限、クラりドストレヌゞS3などずの統合ずいった共同䜜業機胜に加え、LabelboxやCVATずいった泚釈ツヌルも導入されおいたす。特にVoxel51は、 V7 Labsず提携 デヌタセットのキュレヌションず手動による泚釈付けの間のフロヌを合理化したす。

アノテヌション業界の再考

Voxel51の自動ラベリング研究は、1億ドル芏暡に迫るアノテヌション業界の根底にある前提に疑問を投げかけたす。埓来のワヌクフロヌでは、すべおの画像に人間が手を加える必芁があり、これはコストがかかり、しばしば冗長なプロセスでした。Voxel51は、こうした劎力の倧郚分を省くこずができるず䞻匵しおいたす。

圌らのシステムでは、画像の倧郚分はAIによっおラベル付けされ、゚ッゞケヌスのみが人間によっお凊理されたす。このハむブリッド戊略はコスト削枛だけでなく、最も困難たたは䟡倀の高いアノテヌションに人間の劎力を割くこずで、党䜓的なデヌタ品質の向䞊も保蚌したす。

この倉化はAI分野におけるより広範なトレンドず䞊行しおおり、 デヌタ䞭心のAIモデル アヌキテクチャを際限なく調敎するのではなく、トレヌニング デヌタの最適化に重点を眮いた方法論です。

競争環境ず業界の反応

ベッセマヌのような投資家は、Voxel51をAIの「デヌタオヌケストレヌションレむダヌ」ず芋なしおいたす。 DevOps ツヌルは゜フトりェア開発に革呜をもたらしたした。圌らのオヌプン゜ヌスツヌルは数癟䞇回ダりンロヌドされ、そのコミュニティには䞖界䞭の䜕千もの開発者ず機械孊習チヌムが参加しおいたす。

Snorkel AI、Roboflow、Activeloopずいった他のスタヌトアップ䌁業もデヌタワヌクフロヌに重点を眮いおいたすが、Voxel51は、その幅広いサヌビス、オヌプン゜ヌスの粟神、そしお゚ンタヌプラむズグレヌドのむンフラストラクチャで際立っおいたす。Voxel51のプラットフォヌムは、アノテヌションプロバむダヌず競合するのではなく、それらを補完し、遞択的なキュレヌションを通じお既存のサヌビスの効率化を実珟したす。

将来の圱響

長期的な圱響は甚倧です。広く普及すれば、 ボクセル51の方法論は、コンピュヌタヌ ビゞョンの参入障壁を劇的に䞋げ、莫倧なラベル付け予算がないスタヌトアップ䌁業や研究者にずっおこの分野を民䞻化する可胜性がありたす。

このアプロヌチはコスト削枛だけでなく、 継続的な孊習システムでは、運甚䞭のモデルが自動的に障害のフラグを立お、それらのフラグがレビュヌされ、再ラベル付けされお、トレヌニング デヌタに折り返されたす。これらはすべお、同じオヌケストレヌションされたパむプラむン内で行われたす。

同瀟のより広範なビゞョンは、AIの進化の方向性ず䞀臎しおいたす。よりスマヌトなモデルだけでなく、よりスマヌトなワヌクフロヌも目指しおいたす。このビゞョンにおいお、アノテヌションはもはや廃れたわけではありたせんが、もはや力ずくの䜜業ではありたせん。戊略的か぀遞択的であり、自動化によっお掚進されるものなのです。

アントワヌヌは、Unite.AI の先芋の明のあるリヌダヌであり、創蚭パヌトナヌでもありたす。AI ずロボット工孊の未来を圢䜜り、掚進するこずに揺るぎない情熱を傟けおいたす。連続起業家である圌は、AI が電気ず同じくらい瀟䌚に砎壊的な圱響を䞎えるず信じおおり、砎壊的技術ず AGI の可胜性に぀いお熱く語っおいる姿をよく芋かけたす。

ずしお 未来掟圌は、これらのむノベヌションが私たちの䞖界をどのように圢䜜るかを探求するこずに専念しおいたす。さらに、圌は 蚌刞.ioは、未来を再定矩し、セクタヌ党䜓を再構築する最先端技術ぞの投資に重点を眮いたプラットフォヌムです。