Connect with us

Fabiana Clemente, YData์˜ ๊ณต๋™ ์ฐฝ๋ฆฝ์ž ๋ฐ Chief Data Officer – ์ธํ„ฐ๋ทฐ ์‹œ๋ฆฌ์ฆˆ

์ธํ„ฐ๋ทฐ

Fabiana Clemente, YData์˜ ๊ณต๋™ ์ฐฝ๋ฆฝ์ž ๋ฐ Chief Data Officer – ์ธํ„ฐ๋ทฐ ์‹œ๋ฆฌ์ฆˆ

mm

Fabiana Clemente는 YData의 공동 창립자이자 Chief Data Officer입니다. YData는 데이터 중심 개발 솔루션을 하나의 플랫폼에서 데이터 발견, 개선, 확장하는 첫 번째 AI 스타트업입니다.

당신은 초기에 AI와 머신 러닝에 관심을 가지게 된 이유는 무엇인가?

제 배경은 응용 수학에서 왔으며, 데이터에서 정보를 추출하는 방법과 코드를 사용하여 이를 수행하는 방법을 배우고 이해할 수 있는 기회를 가졌습니다. 당시에는 머신 러닝만큼 섹시하지는 않았지만, 해당 분야에 대한 제 열정을 불러일으키는 것이었습니다.

YData의 창립 배경에 대해 이야기해 줄 수 있나요?

스타트업과 기업을 위해 일한 데이터 과학자로서, 데이터에 접근할 때 때때로 보안이나 개인 정보 보호를 이유로 접근이 차단되거나, 접근은 쉬웠지만 데이터의 품질이 AI 기반 솔루션을 구축하기에 충분하지 않은 경우가 있었습니다. 이러한 어려움이 대부분의 조직에서 빈번하게 발생한다는 것을 알게 되면서, 이러한 장애물을 극복하여 개선된 데이터로 AI 개발을 가속화하는 것을 목표로 회사를 설립하게 되었습니다.

합성 데이터에 대해 설명해 줄 수 있나요?

합성 데이터는 실제 세계에서 생성되지 않은 모든 데이터로, 인공적으로 생성된 데이터입니다. 합성 데이터를 생성하는 방법은 규칙 기반 전략부터 머신 러닝 또는 딥 러닝 모델을 사용하여 이러한 “규칙”을 학습하는 방법까지 다양합니다. YData에서는 딥 러닝 기반 전략을採用하여 실제 세계 이벤트의 행동을 유지하면서 개인 정보 보호에 대한 문제가 없는 새로운 데이터를 생성합니다.

합성 데이터가 इतन 중요한 이유는 무엇인가?

조직이 비즈니스 성장에 데이터의 중요성을 더 많이 인식할수록, 합성 데이터의 중요성과 역할이 더 잘 이해될 것입니다. 실제 데이터를 수집하는 것은 시간이 걸리고 비용이 많이 들며, 때때로 불가능할 수도 있습니다. AI 애플리케이션을 구축하려면 데이터가 필수입니다. 여기서 합성 데이터가 구원에 나타납니다. 보이지 않는 시나리오를 생성하거나 단순히 데이터에 대한 접근을 해제하는 능력은 Andrew Ng와 같은 선구자들이 데이터 중심적이 되는 것이 성공적인 AI 채택에 핵심이라고 말하는 세계에서 진화하기 위한 것입니다.

자율 주행 자동차나 기타 기계 자동화 활동에서 이미 합성 데이터의 중요성을 인식할 수 있으며, 이는 모든 산업 분야에 걸쳐 자연스럽게 이해될 것입니다.

YData는 합성 데이터를 어떻게 생성합니까?

YData는 주로 딥 제너레이티브 모델을 사용하여 원본 데이터의 변수 간의 통계적 속성과 상관관계를 학습합니다. 이를 통해 원본 데이터와 동일한 비즈니스 값을 갖는 통계적으로 관련된 데이터 세트를 생성할 수 있으며, 원본 레코드를 추적할 수 없습니다.

YData는 이 기술을 앞으로推進하고 있으며, 합성 데이터 커뮤니티라는 데이터 과학 전문가 그룹을 이끌고 있습니다. 이 그룹은 이 기술을 전파하고 사용하고 싶은 모든 사람을 도와주기 위한 것입니다.

YData 플랫폼은 새로운 데이터 소스를 발견하고 해제하는 데 어떻게 도움이 됩니까?

YData 플랫폼에는 데이터베이스, 데이터 웨어하우스 또는 데이터 레이크와 같은 모든 유형의 데이터에 대한 내장 커넥터가 포함되어 있습니다. 이를 통해 사용자는 실제 레코드를 볼 필요 없이 관련 메타데이터에 쉽게 접근하여 기존 데이터가 손에 잡히는 비즈니스 질문에 유용한지 이해할 수 있습니다.

합성 데이터 오픈 소스 커뮤니티에 대해 자세히 알려주실 수 있나요?

합성 데이터는 아직 초기 단계에 있으며, 이를 생성하는 방법,ประโยชน, 제한에 대한 인식이 아직 널리 퍼지지 않았습니다. 이를 위해 YData에서는 더 교육적인 접근 방식을 취하여 합성 데이터 커뮤니티를 만들었습니다. 이는 아이디어를 교환하거나 합성 데이터 분야의 전문가로부터 도움을 받을 수 있는 곳입니다. 또한 데이터 과학자와 기타 기술 프로필이 합성 데이터에 대한 여정을 시작할 수 있는 곳으로, 문헌에서 가장 интерес 있는 알고리즘 중 일부를 제공합니다.

또한 우리는 데이터 품질에 대한 관점을 제공하여 데이터 과학자들이 데이터를 합성하기 전에 작업하는 데이터를 이해할 수 있도록 합니다. 우리는 데이터 팀이 더 데이터 중심적으로 되도록 도와주는 데真正로 헌신하고 있습니다.

YData는 최근에 국제 확장을 가속화하기 위해 270만 달러의 자금을 확보했다고 발표했습니다. 이는 회사와 확장 전략의 미래에 대해 어떤 의미입니까?

YData는 이미 국제적으로 출발했습니다. 우리는 이러한 기술이 일반적으로 가장 발전된 국가에서 초기 채택자를 필요로 한다는 것을 알았습니다. 따라서 우리의 첫 고객은 이미 포르투갈 외부에 있었으며, 전 유럽에 걸쳐 있으며, 현재 북미에서도 현지를 확립하고 있습니다. 이 자금은 우리가 이러한 대륙에서 상업적으로뿐만 아니라 팀을 성장시키는 데 도움이 될 것입니다. 우리는 완전히 분산된 팀으로, 어디에 있든지 가장优秀한人才를 고용할 수 있습니다.

YData에 대해 더 공유하고 싶은 것이 있나요?

YData는 데이터 중심 AI의 장벽을推進하고 새로운 카테고리를 생성하고 있습니다. DataPrepOps라는 이름은 아마도醜い 이름일 수 있지만, 이는 현재 대부분의 회사에서 직면하는 데이터 과학 개발의 고통입니다. 데이터 품질 트렌드는 계속 성장하고 있으며, 데이터 파이프라인과 데이터 관찰 가능성之后, 데이터 과학 팀을 위한 데이터 품질은 아직 초기 단계에 있습니다. YData는 데이터 준비 분야에서 선도적인 역할을 하고 있습니다.

멋진 인터뷰 감사합니다. 더 많은 정보를 원하는 독자는 YData를 방문할 수 있습니다.

์•™ํˆฌ์•ˆ์€ Unite.AI์˜ ๋น„์ „์žˆ๋Š” ๋ฆฌ๋”์ด์ž ๊ณต๋™ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, AI์™€ ๋กœ๋ด‡๊ณตํ•™์˜ ๋ฏธ๋ž˜๋ฅผ ํ˜•์„ฑํ•˜๊ณ  ์ด‰์ง„ํ•˜๋Š” ๋ฐ ๋Œ€ํ•œ ๋ถˆ๋ณ€์˜ ์—ด์ •์— ์˜ํ•ด ์ถ”๋™๋ฉ๋‹ˆ๋‹ค. ์—ฐ์‡„์ ์ธ ๊ธฐ์—…๊ฐ€๋กœ์„œ, ๊ทธ๋Š” AI๊ฐ€ ์‚ฌํšŒ์— ๋Œ€ํ•œ ์ „๊ธฐ์™€ ๊ฐ™์€ ํŒŒ๊ดด๋ ฅ์„ ๊ฐ€์งˆ ๊ฒƒ์ด๋ผ๊ณ  ๋ฏฟ์œผ๋ฉฐ, ์ข…์ข… ํŒŒ๊ดด์ ์ธ ๊ธฐ์ˆ ๊ณผ AGI์˜ ์ž ์žฌ๋ ฅ์— ๋Œ€ํ•ด ์—ด๊ด‘ํ•ฉ๋‹ˆ๋‹ค.

ไฝœไธบ futurist, ๊ทธ๋Š” ์ด๋Ÿฌํ•œ ํ˜์‹ ์ด ์šฐ๋ฆฌ์˜ ์„ธ๊ณ„๋ฅผ ์–ด๋–ป๊ฒŒ ํ˜•์„ฑํ• ์ง€ ํƒ๊ตฌํ•˜๋Š” ๋ฐ ์ „๋…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ทธ๋Š” Securities.io์˜ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, ๋ฏธ๋ž˜๋ฅผ ์žฌ์ •์˜ํ•˜๊ณ  ์ „์ฒด ๋ถ€๋ฌธ์„ ์žฌํ˜•์„ฑํ•˜๋Š” ์ตœ์ฒจ๋‹จ ๊ธฐ์ˆ ์— ํˆฌ์žํ•˜๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.