Connect with us

Andersonの視点

個人的なコンピュータビジョン文学トレンド2025への取り組み

mm
AI-generated image, by gpt-image-1 via ChatGPT-5.2, featuring a stylized isometric illustration of white-coated scientists in a computer laboratory.

倫理的開示とガウシアンスプラッティングは衰退し、提出された論文の純粋なボリュームは、2026年にAIが対処しなければならない新たな問題を表しています。

 

意見 私は約7年間、arXivや関連する会議など、さまざまな媒体でコンピュータビジョンと画像合成の研究を追ってきました。長い間、繰り返し出現するパターンやトレンドの変化を識別することができました。しかし、これらの観察は経験的です。arXivの出版ストリームだけで、機械学習分析を使用して、隠れた洞察に富んだ膨大なコーパスを利用する時間があれば願います。現状、以前考えたこと 以来 に気づいたことをよりカジュアルに報告するだけです。

ボリューム11

2024年に観察されたAI研究論文の提出トレンドの多くは、2025年に確立されたものとなりました。最も注目すべきのは、AIによって推進されるAI関連論文の ボリューム の絶え間ない増加です。これは、危機 として認識されています:

Monthly computer science Arxiv submissions, October 2023-November 2025, with 3-month rolling average overlaid. Source: https://arxiv.org/stats/monthly_submissions

Monthly computer science Arxiv submissions, October 2023-November 2025, with 3-month rolling average overlaid. Source

この成長率は、AI論文提出のボリュームの指数関数的な倍増として特徴付けられました。 数年前 からこの傾向が見られ、最近のAI投資ブームの到来により、利害関係が高まり、AI関連研究のための資金も増加しています。

2025年の完全な統計はまだ利用できないですが、上記の集計統計は、すべてのカテゴリを通じて一般的な数字が増加していることを表しています。以下に、コンピュータサイエンスが他のカテゴリよりも優位性を保っていることがわかります:

2022-2025 rise in CS submissions. Source - https://info.arxiv.org/about/reports/submission_category_by_year.html

2022-2025 rise in CS submissions. Source

穀物を選別する

10月、秋の会議シーズンの開始は、新しい研究の洪水をもたらすのですが、代わりに DOS攻撃レベルの提出ボリューム があり、研究トレンド分析という研究分野にさらに緊急性が増しました。つまり、論文やリポジトリが増えており、それ自体が、研究シーンの悪化する信号対雑音比を切り抜けることを目指しています。

最新のものは先週、NoveltyRank という 論文GitHubリポジトリ の形で登場しました。これは、Qwen3-4B-Instruct-2507SciBERT などのLLMを微調整して、提出された論文の二値分類(先行提出からの『新規性』の予測)またはペアワイズ新規性比較(現在の提出の『新規性』の比較)を実行できるようにします:

The NoveltyRank system compares the title and abstract of a submission to similar past papers, summarizes the differences using an LLM, and passes this to a fine-tuned Qwen3-4B model that decides if the work counts as 'conceptually new'. Source - https://arxiv.org/pdf/2512.14738

The NoveltyRank system compares the title and abstract of a submission to similar past papers, summarizes the differences using an LLM, and passes this to a fine-tuned Qwen3-4B model that decides if the work counts as ‘conceptually new’. Source

このような『選別』アプローチの問題は、有意義な変数を定義することの挑戦です。NoveltyRankアプローチは、論文の会議への採択を新規性の指標として使用し、ある意味で軽視的に、Arxiv出版を『新規性』の負の指標として使用します。

これは、すべての会議採択提出が新規的または重要であるという初期の誤った前提と、新規性自体が無条件の価値を持つという2番目の誤った前提を前提としています。いくつかの論文が提出されるのは、たとえば、‘出版か死か’のクォータ を維持するためだけであることを知る人は、 新規性は souvent 微妙で、増分作業は重要であることを知っています。

新しい論文の価値を理解するには、AIが現在 非常に弱い 領域があります – 長期的 コンテキスト。論文がしばしば不誠実な方法で書かれているため、地平を突破するように見える論文は、実際には既存の作業に対する小さな進歩であることがよくあります。ただし、自動化システムは、これらのケースに対する『直感』を開発する必要があります。複数の誤った陽性を示すことなく、提出者の著者の誠実さに頼ることなく。

倫理的転落

私が 以前観察したように、Arxivのようなポータルは、かなり laissez faire スクレイピングに抵抗しています。提供されるデータダンプは、詳細な詳細が欠けていることが多いです。

したがって、コンピュータサイエンス論文の十分な代表的なクロスセクションから機能をダウンロードして抽出するためのリソースや時間があっても、多くの繊細なトレンドは対象にならず、分析されません。

その1つは、提出された論文の末尾に 倫理的声明の付録 が存在または不存在することです。生物科学で動物実験に触れる場合、2024年にコンピュータサイエンスカテゴリで提出された作業の倫理的特性付けのトレンドの頂点を見ました。

経験的に、私はこの慣行が2025年を通じて崖から落ちたと言います。私の推測は、AI開発に関して現在の米国政府の厳格な規制緩和の努力が、米国および海外の研究コミュニティに、法的責任からある程度の免除と保護感を与えているということです。

米国政府は、反ディープフェイク規制 を支持していますが、2021-23年の純粋な科学研究が定義された時代とは異なり、現在の米国政府は、実際には多くの『ワイルドウエスト』の姿勢を復活させました。現在の状況は、AIの研究に歴史的な投資が行われている状況です。

生成ビデオ論文としての『AIスロップ』

先週の冬、Hunyuan VideoとWAN 生成ビデオシリーズの発売により、2025年にAIビデオは完全に変わりました。完全な身体のアバターを作成することの難しさや、人物のプロファイルビューを取得することの難しさなどの古い障壁は、まるで一夜で吹き飛ばされました。

中国からのこの種の重み付きリリースは、2025年の生成ビデオリリースのペースを設定し、西側のAIビデオアーキテクチャがより検閲を受け、事前に商業化され、規制される傾向に反対する圧力となっています。

このシーンの『城壁のない』状態は、数百、または数千の企業が、推論のための新しい市場を利用しようとして、ユーザーフレンドリーなポータルを提供するようになりました。 civit.aiRunPod のようなプレイヤーが、多くの場合、家庭用コンピューターで実行できる手順や技術から利益を上げています。

一般に、これらのイニシアチブは、市場の統合によって最終的に上回られることを期待しながら、短期的な金銭的利益を得るものです(ただし、創設者は、偶然にも支配的な市場シェアを獲得した場合、反対しないはずです)。

このような平凡さと複製は、2025年のArxivの提出における生成ビデオストランドにも影響しています。先週 観察したように、このカテゴリの信号対雑音比は、研究者がこの年のブレークスルーによって明らかに解放された大量の潜在的な資金を公的に競争するにつれて、鈍いピークに達しています。

ただし、この種の提出のほとんどは、最善の場合、増分的な進歩です。生成AIの残っている核心的な問題は、今年はあまり表面化していません。アイデンティティを 維持する 必要性、LoRAスタイルで、キャラクター描写全体を通じて、出力ビデオのより長い実行時間を維持すること、環境やテーマなどの整合性を維持すること、生成ビデオとビデオ編集アーキテクチャ内でのオーディオ生成と操作の改善などの必要性。

メッシュ熱が和らぐ

私は先週、伝統的なCGI(1970年代から存在する メッシュベースの表現)を活用するシステムを推進する論文の増加や、神経フレームワークに組み込む ことを観察しました。2025年後半、特にメッシュベースのソリューションへの勢いが減速していることを観察しました。

この前の波の中の多くのCGIを組み込んだソリューション、特に 3Dモーファブルモデル のようなパラメトリックヒューマン『コントロール』フィギュアを扱うものは、Veo、Kling、Hunyuan、WANなどの新しい拡散ベースの生成フレームワークの能力によって置き換えられたかもしれません。

一方、ガウシアンスプラット アプローチを扱う論文は、発展の停滞や、2025年の拡散ベースのgen AIシステムによって追い越されたことによって影響を受けたようです。

1年前、私はガウシアンスプラッティングの初期の興奮が、2023年後半に注目 を集めたが、狭い研究ラインに収束したと指摘しました。この年、私はこのアプローチの重要なリソース要求やその他の問題に対処しようとする一連の論文を見ています。

ガウシアンスプラッティングは現在『停滞している』と特徴づけますが、この技術は1990年代初頭に遡り、復活の性質を持つことを覚えておく必要があります。

メッシュベースのアプローチからのこの一般的な撤退の例外は、3Dプリンティングを目的としたフレームワークにAIを組み込むことへの関心の増大です。

AIセキュリティ提出の減少

2025年の私の最後の観察は、Arxivのコンピュータサイエンスセクションの『セキュリティ』提出カテゴリが、頻度と質で著しく減少していることです。理由は簡単に推測することができません。

暗号とセキュリティ アーカイブは、当然ながら、主に私的セクターの独自の知的財産によって支配されるこの研究分野のために、常に二次的な場所で論文を投稿する場所でした。ほとんどの知的財産は学術ジャーナルに表面化せず、ほとんどが無料プラットフォームであるArxivに表示されません。

さらに、Arxivのこのカテゴリへの提出には、提出された論文の明らかな価値と新規性を否定または軽減する『潜んだ』認識や『白箱』アクセスなどの『落とし穴』が多くあります。たとえば、実際には攻撃者がアクセスできない特権アクセスに依存するセンセーショナルなセキュリティ侵害方法などです。

2026年の期待

メディアは、Gen AIブームを初期の2000年代のドットコムブームとバーストの繰り返しとして リフ をしています。 常に一部の異議 あり)。ただし、これはある種の誤った安心感を表しています。インフラ、投資、文化 および 研究の点で、人類史上にこれほどの時期はありません。

したがって、2026年の研究シーンのトレンドは、通常、長期的な取り組みが今から4月の間に結実し、2025年の偏見やトレンドの特定の『スタンプ』がそれらを特徴付けることを予測することは困難です。

Arxivや他のポータルでの提出ボリュームの危機を助ける可能性のある開発は、AI生成/支援論文に対する禁止またはチェックです。 Arxivが最近、レビュー論文に施行 したように。しかし、AIの関与の程度は、提出者の誠実さに頼ることなく、複数の誤った陽性を示すことなく、測定することが難しい可能性があります。

 

初めて公開:2025年12月22日

機械学習に関するライター、ヒューマンイメージシンセシスのドメインスペシャリスト。Metaphysic.aiの研究コンテンツ責任者を務めた。