Rescale λ―ΈνŒ… μ˜ˆμ•½

Anthropic, μ΅œμ‹  Claude AI μ—…λ°μ΄νŠΈμ—μ„œ Visual PDF 뢄석 μΆœμ‹œ

인곡지λŠ₯

Anthropic, μ΅œμ‹  Claude AI μ—…λ°μ΄νŠΈμ—μ„œ Visual PDF 뢄석 μΆœμ‹œ

mm
이미지: 인λ₯˜ν•™

λ¬Έμ„œ 처리의 μ€‘μš”ν•œ λ°œμ „μœΌλ‘œ, 인λ₯˜ Claude 3.5 Sonnet λͺ¨λΈμ— λŒ€ν•œ μƒˆλ‘œμš΄ PDF 지원 κΈ°λŠ₯을 κ³΅κ°œν–ˆμŠ΅λ‹ˆλ‹€. 이 κ°œλ°œμ€ κΈ°μ‘΄ λ¬Έμ„œ ν˜•μ‹κ³Ό AI 뢄석 κ°„μ˜ 격차λ₯Ό λ©”μš°λŠ” 데 μžˆμ–΄ μ€‘μš”ν•œ 진전을 λ‚˜νƒ€λ‚΄λ©°, 쑰직이 κΈ°μ‘΄ λ¬Έμ„œ μΈν”„λΌμ—μ„œ κ³ κΈ‰ AI κΈ°λŠ₯을 ν™œμš©ν•  수 μžˆλ„λ‘ ν•©λ‹ˆλ‹€.

이 톡합은 AI λ¬Έμ„œ 처리의 μ§„ν™”μ—μ„œ μ€‘μš”ν•œ μˆœκ°„μ— λ„λ‹¬ν–ˆμŠ΅λ‹ˆλ‹€. 기업듀이 ν…μŠ€νŠΈμ™€ μ‹œκ°μ  μš”μ†Œκ°€ λͺ¨λ‘ ν¬ν•¨λœ λ³΅μž‘ν•œ λ¬Έμ„œλ₯Ό μ²˜λ¦¬ν•˜κΈ° μœ„ν•œ μ›ν™œν•œ μ†”λ£¨μ…˜μ„ 점점 더 많이 μ°Ύκ³  있기 λ•Œλ¬Έμž…λ‹ˆλ‹€. 이 κ°•ν™”λ₯Ό 톡해 Claude 3.5 Sonnet은 포괄적인 λ¬Έμ„œ λΆ„μ„μ˜ μ΅œμ „μ„ μ— μ„œκ²Œ λ˜μ—ˆμœΌλ©°, PDFκ°€ μ—¬μ „νžˆ λΉ„μ¦ˆλ‹ˆμŠ€ λ¬Έμ„œμ˜ ν‘œμ€€ ν˜•μ‹μΈ μ „λ¬Έ ν™˜κ²½μ—μ„œ μ€‘μš”ν•œ μš”κ΅¬ 사항을 ν•΄κ²°ν•©λ‹ˆλ‹€.

기술적 인 λŠ₯λ ₯

μƒˆλ‘­κ²Œ κ΅¬ν˜„λœ PDF 처리 μ‹œμŠ€ν…œμ€ μ •κ΅ν•œ 닀측적 μ ‘κ·Ό 방식을 톡해 μž‘λ™ν•©λ‹ˆλ‹€. 이 μ‹œμŠ€ν…œμ˜ 핡심은 3단계 처리 방법둠을 μ±„νƒν•©λ‹ˆλ‹€.

  1. ν…μŠ€νŠΈ μΆ”μΆœ: 이 μ‹œμŠ€ν…œμ€ ꡬ쑰적 무결성을 μœ μ§€ν•˜λ©΄μ„œ λ¬Έμ„œμ˜ ν…μŠ€νŠΈ μ½˜ν…μΈ λ₯Ό μ‹λ³„ν•˜κ³  μΆ”μΆœν•˜λŠ” κ²ƒμœΌλ‘œ μ‹œμž‘ν•©λ‹ˆλ‹€.

  2. μ‹œκ°μ  처리: 각 νŽ˜μ΄μ§€λŠ” 이미지 ν˜•μ‹μœΌλ‘œ λ³€ν™˜λ˜λ©°, 이λ₯Ό 톡해 μ‹œμŠ€ν…œμ€ 차트, κ·Έλž˜ν”„, λ‚΄μž₯된 κ·Έλ¦Ό λ“±μ˜ μ‹œκ°μ  μš”μ†Œλ₯Ό μΊ‘μ²˜ν•˜κ³  뢄석할 수 μžˆμŠ΅λ‹ˆλ‹€.

  3. 톡합 뢄석: λ§ˆμ§€λ§‰ λ‹¨κ³„μ—μ„œλŠ” ν…μŠ€νŠΈμ™€ μ‹œκ°μ  데이터 μŠ€νŠΈλ¦Όμ„ λͺ¨λ‘ κ²°ν•©ν•˜μ—¬ 포괄적인 λ¬Έμ„œ 이해 및 해석이 κ°€λŠ₯ν•©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ 톡합적 μ ‘κ·Ό 방식을 톡해 ν΄λ‘œλ“œ 3.5 μ†Œλ„€νŠΈλŠ” ν…μŠ€νŠΈμ™€ μ‹œκ°μ  μš”μ†Œ λͺ¨λ‘μ—μ„œ λ§₯락을 μœ μ§€ν•˜λ©΄μ„œ μž¬λ¬΄μ œν‘œ 뢄석, 법λ₯  λ¬Έμ„œ 해석, λ¬Έμ„œ λ²ˆμ—­ 지원 λ“±μ˜ λ³΅μž‘ν•œ μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 

κ΅¬ν˜„ 및 μ•‘μ„ΈμŠ€

PDF 처리 κΈ°λŠ₯은 ν˜„μž¬ 두 κ°€μ§€ κΈ°λ³Έ 채널을 톡해 μ œκ³΅λ©λ‹ˆλ‹€.

  • Claude Chat κΈ°λŠ₯ λ―Έλ¦¬λ³΄κΈ°λŠ” μ‚¬μš©μžμ™€μ˜ 직접적인 μƒν˜Έμž‘μš©μ„ μœ„ν•΄ μ œκ³΅λ©λ‹ˆλ‹€.
  • νŠΉμ • 헀더 "anthropic-beta: pdfs-2024-09-25"λ₯Ό ν™œμš©ν•œ API μ•‘μ„ΈμŠ€

κ΅¬ν˜„ μΈν”„λΌλŠ” 처리 νš¨μœ¨μ„±μ„ μœ μ§€ν•˜λ©΄μ„œ λ‹€μ–‘ν•œ λ¬Έμ„œ λ³΅μž‘μ„±μ„ μˆ˜μš©ν•©λ‹ˆλ‹€. 기술적 μš”κ΅¬ 사항은 μ΅œλŒ€ 32MB 및 100νŽ˜μ΄μ§€ 길이의 λ¬Έμ„œλ₯Ό μ§€μ›ν•˜μ—¬ μ‹€μ œ λΉ„μ¦ˆλ‹ˆμŠ€ μ‚¬μš©μ— μ΅œμ ν™”λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 이 사양 ν”„λ ˆμž„μ›Œν¬λŠ” 전문적인 ν™˜κ²½μ—μ„œ 일반적으둜 μ‚¬μš©λ˜λŠ” κ΄‘λ²”μœ„ν•œ λ¬Έμ„œ μœ ν˜• 및 ν¬κΈ°μ—μ„œ μ•ˆμ •μ μΈ μ„±λŠ₯을 보μž₯ν•©λ‹ˆλ‹€.

μ•žμœΌλ‘œ Anthropic은 Amazon Bedrockκ³Ό Google Vertex AIλ₯Ό νŠΉλ³„νžˆ νƒ€κ²ŸμœΌλ‘œ ν•˜λŠ” ν™•μž₯된 ν”Œλž«νΌ 톡합에 λŒ€ν•œ κ³„νšμ„ μ„€λͺ…ν–ˆμŠ΅λ‹ˆλ‹€. 이 κ³„νšλœ ν™•μž₯은 μ£Όμš” ν΄λΌμš°λ“œ μ„œλΉ„μŠ€ κ³΅κΈ‰μžμ™€μ˜ 더 κ΄‘λ²”μœ„ν•œ μ ‘κ·Όμ„±κ³Ό 톡합에 λŒ€ν•œ μ˜μ§€λ₯Ό 보여주며, 더 λ§Žμ€ 쑰직이 κΈ°μ‘΄ 기술 인프라 λ‚΄μ—μ„œ μ΄λŸ¬ν•œ κΈ°λŠ₯을 ν™œμš©ν•  수 μžˆλ„λ‘ ν•  κ°€λŠ₯성이 μžˆμŠ΅λ‹ˆλ‹€.

톡합 μ•„ν‚€ν…μ²˜λŠ” λ‹€λ₯Έ Claude κΈ°λŠ₯, 특히 도ꡬ μ‚¬μš© κΈ°λŠ₯κ³Ό μ›ν™œν•˜κ²Œ κ²°ν•©λ˜μ–΄ μ‚¬μš©μžκ°€ νŠΉμ • μ• ν”Œλ¦¬μΌ€μ΄μ…˜μ— ν•„μš”ν•œ νŠΉμ • 정보λ₯Ό μΆ”μΆœν•  수 μžˆλ„λ‘ μ§€μ›ν•©λ‹ˆλ‹€. μ΄λŸ¬ν•œ μƒν˜Έ μš΄μš©μ„±μ€ λ‹€μ–‘ν•œ μ‚¬μš© 사둀와 μ›Œν¬ν”Œλ‘œμš°μ—μ„œ μ‹œμŠ€ν…œμ˜ μœ μš©μ„±μ„ ν–₯μƒμ‹œμΌœ 쑰직의 기술 κ΅¬ν˜„ 및 ν™œμš© 방식에 μœ μ—°μ„±μ„ μ œκ³΅ν•©λ‹ˆλ‹€.

μ‹€μ œ μ‘μš© ν”„λ‘œκ·Έλž¨

Claude 3.5 Sonnet에 PDF 처리 κΈ°λŠ₯이 ν†΅ν•©λ˜μ–΄ λ‹€μ–‘ν•œ 뢄야에 μƒˆλ‘œμš΄ κ°€λŠ₯성이 μ—΄λ¦½λ‹ˆλ‹€. 금육 기관은 이제 μ—°λ‘€ λ³΄κ³ μ„œ, 투자 μ„€λͺ…μ„œ 및 투자 λ¬Έμ„œ 뢄석을 μžλ™ν™”ν•  수 있으며, 법λ₯  νšŒμ‚¬λŠ” 계약 κ²€ν†  및 싀사 절차λ₯Ό κ°„μ†Œν™”ν•  수 μžˆμŠ΅λ‹ˆλ‹€. ν…μŠ€νŠΈμ™€ μ‹œκ°μ  μš”μ†Œλ₯Ό λͺ¨λ‘ μ²˜λ¦¬ν•  수 μžˆλŠ” 이 μ‹œμŠ€ν…œμ€ 데이터 μ‹œκ°ν™” 및 기술 λ¬Έμ„œμ— μ˜μ‘΄ν•˜λŠ” 산업에 특히 μœ μš©ν•©λ‹ˆλ‹€.

ꡐ윑 κΈ°κ΄€κ³Ό 연ꡬ 기관은 ν–₯μƒλœ λ¬Έμ„œ λ²ˆμ—­ κΈ°λŠ₯을 톡해 λ‹€κ΅­μ–΄ ν•™μˆ  λ…Όλ¬Έ 및 연ꡬ λ¬Έμ„œλ₯Ό μ›ν™œν•˜κ²Œ μ²˜λ¦¬ν•  수 μžˆμŠ΅λ‹ˆλ‹€. ν…μŠ€νŠΈμ™€ ν•¨κ»˜ μ°¨νŠΈμ™€ κ·Έλž˜ν”„λ₯Ό ν•΄μ„ν•˜λŠ” 이 κΈ°μˆ μ€ κ³Όν•™ 좜판물과 기술 λ³΄κ³ μ„œμ— λŒ€ν•œ 포괄적인 이해λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

기술 사양 및 μ œν•œ 사항

졜적의 κ΅¬ν˜„μ„ μœ„ν•΄μ„œλŠ” μ‹œμŠ€ν…œ λ§€κ°œλ³€μˆ˜λ₯Ό μ΄ν•΄ν•˜λŠ” 것이 맀우 μ€‘μš”ν•©λ‹ˆλ‹€. ν˜„μž¬ ν”„λ ˆμž„μ›Œν¬λŠ” νŠΉμ • 경계 λ‚΄μ—μ„œ μž‘λ™ν•©λ‹ˆλ‹€.

  • 파일 크기 관리: λ¬Έμ„œλŠ” 32MB μ΄ν•˜λ‘œ μœ μ§€λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.
  • νŽ˜μ΄μ§€ μ œν•œ: λ¬Έμ„œλ‹Ή μ΅œλŒ€ 100νŽ˜μ΄μ§€ μš©λŸ‰
  • λ³΄μ•ˆ μ œμ•½: μ•”ν˜Έν™”λ˜κ±°λ‚˜ μ•”ν˜Έλ‘œ 보호된 PDFλŠ” μ§€μ›λ˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€.

처리 λΉ„μš© κ΅¬μ‘°λŠ” 토큰 기반 λͺ¨λΈμ„ μ€‘μ‹¬μœΌλ‘œ μ„€κ³„λ˜μ—ˆμœΌλ©°, νŽ˜μ΄μ§€ μš”κ΅¬ 사항은 μ½˜ν…μΈ  밀도에 따라 λ‹€λ¦…λ‹ˆλ‹€. 일반적인 μ†ŒλΉ„ λ²”μœ„λŠ” νŽ˜μ΄μ§€λ‹Ή 1,500~3,000개의 토큰이며, μΆ”κ°€ 프리미엄 없이 ν‘œμ€€ 토큰 가격에 ν†΅ν•©λ©λ‹ˆλ‹€. 이 투λͺ…ν•œ 가격 λͺ¨λΈμ„ 톡해 쑰직은 κ΅¬ν˜„ 및 μ‚¬μš©μ— λŒ€ν•œ μ˜ˆμ‚°μ„ 효과적으둜 μ±…μ •ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ΅œμ ν™” μ§€μΉ¨

μ‹œμŠ€ν…œμ˜ νš¨μœ¨μ„±μ„ κ·ΉλŒ€ν™”ν•˜κΈ° μœ„ν•΄ λͺ‡ κ°€μ§€ μ£Όμš” μ΅œμ ν™” μ „λž΅μ΄ ꢌμž₯λ©λ‹ˆλ‹€.

λ¬Έμ„œ μ€€λΉ„:

  • λͺ…ν™•ν•œ ν…μŠ€νŠΈ ν’ˆμ§ˆκ³Ό 가독성을 보μž₯ν•˜μ„Έμš”
  • μ μ ˆν•œ νŽ˜μ΄μ§€ 정렬을 μœ μ§€ν•˜μ„Έμš”
  • ν‘œμ€€ νŽ˜μ΄μ§€ 번호 λ§€κΈ°κΈ° μ‹œμŠ€ν…œ ν™œμš©

API κ΅¬ν˜„:

  • API μš”μ²­μ—μ„œ PDF μ½˜ν…μΈ λ₯Ό ν…μŠ€νŠΈ μ•žμ— 배치
  • λ°˜λ³΅λ˜λŠ” λ¬Έμ„œ 뢄석을 μœ„ν•œ μ‹ μ†ν•œ 캐싱 κ΅¬ν˜„
  • 크기 μ œν•œμ„ μ΄ˆκ³Όν•˜λŠ” 경우 더 큰 λ¬Έμ„œλ₯Ό λΆ„ν• ν•©λ‹ˆλ‹€.

μ΄λŸ¬ν•œ μ΅œμ ν™” 관행은 처리 νš¨μœ¨μ„±μ„ 높이고 μ „λ°˜μ μΈ κ²°κ³Όλ₯Ό κ°œμ„ ν•©λ‹ˆλ‹€. 특히 λ³΅μž‘ν•˜κ±°λ‚˜ κΈ΄ λ¬Έμ„œλ₯Ό μ²˜λ¦¬ν•  λ•Œ κ·Έλ ‡μŠ΅λ‹ˆλ‹€.

νžˆν”„ 라인

Claude 3.5 Sonnet에 PDF 처리 κΈ°λŠ₯이 ν†΅ν•©λœ 것은 AI λ¬Έμ„œ 뢄석 λΆ„μ•Όμ—μ„œ μƒλ‹Ήν•œ 진전을 μ˜λ―Έν•˜λ©°, μ‹€μš©μ μΈ 접근성을 μœ μ§€ν•˜λ©΄μ„œλ„ μ •κ΅ν•œ λ¬Έμ„œ μ²˜λ¦¬μ— λŒ€ν•œ ν•„μˆ˜μ μΈ μš”κ΅¬λ₯Ό μΆ©μ‘±ν•©λ‹ˆλ‹€. 기업듀이 μš΄μ˜μ„ μ§€μ†μ μœΌλ‘œ 디지털화함에 따라, μ΄λŸ¬ν•œ λ°œμ „μ€ Anthropic의 κ³„νšλœ ν”Œλž«νΌ ν™•μž₯κ³Ό κ²°ν•©ν•˜μ—¬ κΈ°μ—…μ˜ λ¬Έμ„œ 관리 및 뢄석 방식을 잠재적으둜 ν˜μ‹ ν•  수 μžˆλŠ” κΈ°μˆ μ„ μ œκ³΅ν•©λ‹ˆλ‹€. 

포괄적인 λ¬Έμ„œ 이해 κΈ°λŠ₯, λͺ…ν™•ν•œ 기술적 λ§€κ°œλ³€μˆ˜, μ΅œμ ν™” ν”„λ ˆμž„μ›Œν¬λ₯Ό κ°–μΆ˜ 이 μ‹œμŠ€ν…œμ€ AIλ₯Ό 톡해 λ¬Έμ„œ 처리λ₯Ό κ°œμ„ ν•˜κ³ μž ν•˜λŠ” 쑰직에 μœ λ§ν•œ μ†”λ£¨μ…˜μ„ μ œκ³΅ν•©λ‹ˆλ‹€.

Alex McFarlandλŠ” 인곡 μ§€λŠ₯의 μ΅œμ‹  κ°œλ°œμ„ νƒκ΅¬ν•˜λŠ” AI μ €λ„λ¦¬μŠ€νŠΈμ΄μž μž‘κ°€μž…λ‹ˆλ‹€. κ·ΈλŠ” μ „ 세계 μˆ˜λ§Žμ€ AI μŠ€νƒ€νŠΈμ—… 및 좜판물과 ν˜‘λ ₯ν•΄ μ™”μŠ΅λ‹ˆλ‹€.