Anderson의 관점

AI는 비밀이적으로 이미지의 기기 브랜드에 따라 순위를 매길 수 있다, 내용이 아니라

Published August 20, 2025

Updated April 26, 2026

Martin Anderson

A robot preferring a Mac over other junked laptops in the blurred background. Flux 1D and Firefly, via Krita.

새로운 연구에 따르면 인기 있는 이미지 중심 AI 시스템은 사진 속에 무엇이 있는지 뿐만 아니라 사진이 어떻게 찍혔는지에도 관심을 가진다. 카메라 유형이나 이미지 품질과 같은 숨겨진 세부 사항은 조용히 AI가 무엇을 보는지에 영향을 미쳐 잘못된 결과로 이어질 수 있다. 단지 사진이 다른 기기에서 왔기 때문이다.

2012년에 certain 여행 웹사이트가 Apple 기기를 사용하는 사용자에게 더 높은 가격을 보여주는 것으로 밝혀졌는데, 이는 Apple 브랜드를 더 높은 지출 능력과 연관시킴으로써였다. 이후 조사에 따르면 이러한 기기 중심의 ‘지갑嗅ぎ’는 전자상거래 사이트에서 거의 정상적인 것이 되었다.

유사하게, 특정 사진을 찍은 스마트폰이나 캡처 기기는 법의학적 수단을 통해 추론될 수 있는데, 이는 제한된 수의 렌즈가 있는 모델의 알려진 특성에 기반한다. 이러한 경우, 캡처 기기의 모델은 일반적으로 시각적 흔적에 의해 추정되며, 2012년 사건과 마찬가지로 이미지에 사용된 카메라 유형을 아는 것은 잠재적으로 악용될 수 있는 특성이다.

캡처 기기는 일반적으로 이미지에 상당한 메타데이터를 삽입하지만, 이 기능은 사용자에 의해 종종 끌 수 있다. 메타데이터가 켜져 있는 경우에도, 소셜 미디어 네트워크와 같은 배포 플랫폼은 메타데이터의 일부 또는 전부를 제거할 수 있다. 이는 물리적인 또는 개인 정보 보호 목적, 또는 둘 다에 의한 것이다.

그러나 사용자 업로드 이미지의 메타데이터는 종종 다시 작성되거나 해석되거나(삭제되지 않음), 또는 이미지에 대한 보조 정보源으로 남아 있게 된다. 즉, 이미지의 내용이 아니라 이미지가 어떻게 찍혔는지를 설명한다. 2012년 사건에서 밝혀진 것처럼, 이러한 종류의 정보는 상업 플랫폼뿐만 아니라 해커와 악의적인 행위자에게도 유용할 수 있다.

이중 관점

일본과 체코 공화국 간의 새로운 연구 협력에 따르면, 카메라 하드웨어와 이미지 처리(예: JPEG 품질 또는 렌즈 샤픈닝)에 의해 남겨진 흔적은 법의학적 도구에 의해 감지될 뿐만 아니라 선도적인 AI 비전 모델의 ‘전역 이해’에 조용히 인코딩된다.

이것은 CLIP와 다른 대규모 시각 인코더를 포함하며, 검색 엔진에서 콘텐츠 모더레이션에 이르기까지 모든 곳에서 널리 사용된다. 새로운 연구는 이러한 모델이 단순히 사진 속에 무엇이 있는지 해석하는 것이 아니라, 사진이 어떻게 찍혔는지도 학습할 수 있으며, 이 숨겨진 신호는 때때로 가시적 내용을凌駕할 수 있다.

… (중략)

결론

문헌에는 ‘방법보다 내용’의 흔적과 징조에 대한 法的 관심이 증가하고 있다. 프레임 도메인 또는 특정 데이터셋을 식별하기가 càng 쉬울수록, 이 정보를 깊은 가짜 감지기 또는 데이터 및 모델의 출처 또는 연대를 분류하기 위한 시스템과 같은 형태로 활용하기가 càng 쉬워진다.

이 모든 것은 AI 모델을 훈련하는 핵심 의도에 반한다. 즉, 중추적인 개념은 생산 수단과 독립적으로 구축되어야 하며, 그 흔적을 남겨서는 안 된다. 실제로 데이터셋과 캡처 기기는 내용과 분리할 수 없는 특성과 도메인 특성을 가지고 있다. 왜냐하면 그 자체로 역사적인 관점을 나타내기 때문이다.

* 이 논문은 비정상적으로 구성되어 있으며, 우리는 가능한 한 잘 구성된 형식과 표현에 맞추도록 할 것이다. ‘방법’ 섹션이 없는 경우에 해당하는 많은 자료가 다양한 부록 부분으로 이동되었을 것으로 추정되며, 이는 주 논문을 8페이지로 제한하기 위한 것으로 보인다. 우리가 명확성을 위해 시간 부족으로 인해 이러한 기회를 놓쳤다면, 우리는 사과한다.

최초로 2025년 8월 20일에 게시됨