Connect with us

AIは人の年齢から写真の撮影年を推測できる

Andersonの視点

AIは人の年齢から写真の撮影年を推測できる

mm
An image from the source paper 'Photo Dating by Facial Age Aggregation', overlaid against an image of a desk surface with a 1974 calendar on it. Source: eBay and Source paper + Firefly V3.

新しい研究によると、AIは人の顔から写真の撮影年を推測できることがわかった。顔認識と年齢推測を組み合わせて、現在のシーンベースの手法を上回る精度を達成した。

 

過去には、髪型や服装のファッションが急速に変化していたため、写真の撮影年を推測するのが比較的容易だった。しかし、約30年前から、この視覚的なスタイルの変化が終了し、現在は髪型や服装から撮影年を推測するのが難しくなっている。

一時期は、画像や映画の撮影年を、カラーレゾリューションやフィルムのグレイン特性から推測することも可能だった。専門家でなくても、古い映画を多く見れば、文化的なヒント(音楽、車、ファッション、テーマなど)が、映画のスタイルと関連付けられる。

フィルムのグレイン特性の改善が、皮膚のトーンや照明スタイルの範囲を時間の経過とともに拡大したことを示すイラスト。[ ソース ] https://archive.is/3ZSjN (私の記事)

フィルムのグレイン特性の改善が、皮膚のトーンや照明スタイルの範囲を時間の経過とともに拡大したことを示すイラスト。 ソース (私の記事)

写真の撮影年を推測するための別の「アンカー」は、写真が白黒かカラーかだったことである。デジタルカメラの普及により、この「アンカー」はもはや不要になった。

MyHeritageのPhotoDaterのような商用および実験システムは、様々な基準を使用して写真の撮影年を推測しようとする。

MyHeritageのPhotoDaterサービスの写真推定の例。ソース [ https://www.youtube.com/watch?v=2oVyLI6tBcY ]

MyHeritageのPhotoDaterサービスの写真推定の例。 ソース

他の特徴的な兆候(スマートフォンや時代特有の技術など)がなければ、過去15〜25年以内に撮影された写真の撮影年を推測する最も良い方法は、写真の人を知っている場合(たとえば、有名人または知人)で、年齢を推測することである。

顔の年齢を基準とする

コンピュータビジョン分野やその他の分野(たとえば、法医学、保存処理、ジャーナリズム、データセットアーキテクチャなど)では、写真の撮影年を決定する能力は、多くのデジタルおよびアナログコレクションが適切な注釈やメタデータを欠いているか、または不正確なメタデータを持っているため、貴重な目標である。

したがって、AIシステムが私たちが歴史コレクションを眺めながら「ああ、こんなに昔だったね」とコメントするように、写真を検討できることが役立つ。

チェコ共和国からの新しい研究論文は、このアプローチへの初期の手がかりを提供し、AIベースの年齢認識システムと、共通のデータベースにリンクされた顔認識システムを利用している。

1974年の「Joachim, Put It in the Machine」の静止画。モデルは写真の中で知られている個人の検出、顔の年齢推測(右列)、および各個人の生年月日から推定年齢を差し引いて、写真の撮影年に関する確率分布を生成する。グラフは各年齢推定の可能性を示し、破線は個人の真の年齢を示す。[ ソース ] https://arxiv.org/pdf/2511.05464

1974年の「Joachim, Put It in the Machine」の静止画。モデルは写真の中で知られている個人の検出、顔の年齢推測(右列)、および各個人の生年月日から推定年齢を差し引いて、写真の撮影年に関する確率分布を生成する。グラフは各年齢推定の可能性を示し、破線は個人の真の年齢を示す。 ソース

システムは、写真の中で知られている個人の検出、顔の年齢推測、各個人の生年月日から推定年齢を差し引いて、写真の撮影年に関する確率分布を生成する。

方法

写真の撮影年を推測するために、著者は、チェコの映画データベース(CSFD)からキュレーションされた画像を使用した。

システムは、各検出された顔に対して、誰であるかを推測し、既知の個人のデータベースを使用して、各個人の生年月日から推定年齢を差し引いて、写真の撮影年を推測する。

メトリックとデータ

平均絶対誤差(MAE)は、予測年と既知の基準事実の間の差を示す。

データは、5つのパートに分割され、すべての画像が同じパーティション内に保持されるように注意された。

結果

結果のセクションは、複数のパフォーマンス指標にわたって分割されている。

最も重要な結果は、顔の年齢推定モデル(特に「Full」と「Top-1」バリアント)が、2つ以上の知られている個人が存在する場合に、強力な「Scene」ベースラインを上回るパフォーマンスを示す。

結論

新しい研究論文は、コンピュータビジョン分野における最も興味深いトピックの1つを扱っている。

 

* 音楽の進化も同様に変化の速度を遅めている。

2025年11月10日初出。

機械学習に関するライター、ヒューマンイメージシンセシスのドメインスペシャリスト。Metaphysic.aiの研究コンテンツ責任者を務めた。