์ธ๊ณต์ง๋ฅ
Ingo Mierswa, RapidMiner, Inc์ ์ค๋ฆฝ์ ๋ฐ ์ฌ์ฅ – ์ธํฐ๋ทฐ ์๋ฆฌ์ฆ

Ingo Mierswa는 RapidMiner, Inc의 설립자 및 사장입니다. RapidMiner는 오픈이고 확장 가능한 데이터 과학 플랫폼을 통해 기업에 인공지능을 제공합니다. 분석 팀을 위해 구축된 RapidMiner는 데이터 준비에서 기계 학습 및 예측 모델 배포까지 데이터 과학 라이프 사이클을 통일합니다. 62만 5천 명 이상의 분석 전문가가 수익을 창출하고 비용을 절감하며 위험을 피하기 위해 RapidMiner 제품을 사용합니다.
당신이 RapidMiner를 출시한 영감은 무엇입니까?
私は데이터 과학 컨설팅 비즈니스에서 많은 년간 일했으며, 데이터 과학에 대한 공식적인 교육이 없는 사람들에게 더 직관적이고 접근하기 쉬운 플랫폼이 필요하다는 것을 깨달았습니다. 당시 존재하는 대부분의 솔루션은 코딩과 스크립팅에 의존했으며 사용자 친화적이지 않았습니다. 또한 데이터를 관리하고 유지하기가 어려웠습니다. 기본적으로, 이러한 프로젝트가 इतन難할 필요는 없다는 것을 깨달았습니다. 따라서, 우리는 누구나 훌륭한 데이터 과학자가 될 수 있도록 RapidMiner 플랫폼을 만들기 시작했습니다.
현재 RapidMiner에서 사용되는 전체 투명성 거버넌스를 논의할 수 있습니까?
모델을 설명할 수 없으면 튜닝, 신뢰, 번역이 어려워집니다. 많은 데이터 과학 작업은 결과를 다른 사람에게 전달하여 이해할 수 있도록 프로세스를 개선하는 것입니다. 이는 신뢰와 깊은 이해가 필요합니다. 또한 신뢰와 번역에 대한 문제는 모델을 프로덕션에 넣는 것을 매우 어렵게 만들 수 있습니다. 우리는 몇 가지 다른 방법으로 이 전투를 치루고 있습니다:
RapidMiner는 시각적인 데이터 과학 플랫폼으로서, 데이터 파이프라인과 모델에 대한 설명을 매우 소비하기 쉬운 형식으로 매핑합니다. 이는 모델을 투명하게 만들고 사용자가 모델의 행동과 강점 및 약점을 이해하고 잠재적인 편향을 감지하는 데 도움이 됩니다.
추가로, 플랫폼에서 생성된 모든 모델은 사용자에게 광범위한 시각화를 제공합니다. 일반적으로 모델을 생성한 사용자에게 모델에 대한 통찰력을 얻고 모델의 행동을 이해하고 모델의 편향을 평가할 수 있습니다.
RapidMiner는 또한 모델 설명을 제공합니다. 즉, 모델이 생성한 각 예측에 대해 RapidMiner는 모델의 결정에 영향을 미친 영향 요인을 생성하고 추가합니다.
마지막으로 – 이는 개인적으로 매우 중요합니다. 몇 년 전 엔지니어링 팀과 함께 이 작업을 진행했습니다 – RapidMiner는 또한 매우 강력한 모델 시뮬레이터 기능을 제공합니다. 이는 사용자가 입력 데이터를 제공하여 모델의 행동을 시뮬레이션하고 관찰할 수 있도록 허용합니다. 입력 데이터를 쉽게 설정하고 변경할 수 있어 사용자가 다양한 가상 또는 실제 사례에서 모델의 예측 행동을 이해할 수 있습니다. 시뮬레이터는 모델의 결정에 영향을 미치는 요소를 표시합니다. 사용자 – 이 경우 비즈니스 사용자 또는 도메인 전문가 – 는 모델의 행동을 이해하고 모델의 결정이 실제 결과 또는 도메인 지식과 일치하는지 확인하고 문제를 식별할 수 있습니다. 시뮬레이터를 사용하면 실제 세계를 시뮬레이션하고 미래를 볼 수 있습니다. 실제로 당신의 미래입니다.
RapidMiner는 어떻게 깊은 학습을 사용합니까?
RapidMiner의 깊은 학습 사용은 우리가 매우 자랑스럽게 생각하는 것입니다. 깊은 학습은 적용하기 매우 어려울 수 있으며, 비-데이터 과학자들은 전문가의 지원 없이 네트워크를 설정하는 데 어려움을 겪을 수 있습니다. RapidMiner는 이 프로세스를 모든 유형의 사용자에게 가능한 한 간단하게 만듭니다. 깊은 학습은 예를 들어 우리의 자동 기계 학습(ML) 제품인 RapidMiner Go의 일부입니다. 여기서 사용자는 이러한 복잡한 모델을 사용하기 위해 깊은 학습에 대해 아무것도 알 필요가 없습니다. 또한, 파워 사용자는 Tensorflow, Keras 또는 DeepLearning4J와 같은 인기 있는 깊은 학습 라이브러리를 사용하여 RapidMiner와 함께 시각적 워크플로우를 구축할 수 있습니다. 이는 블록을 조작하는 것과 비슷하며 데이터 과학 기술이 적은 사용자에게 경험을 단순화합니다. 이 접근 방식을 통해 사용자는 다양한 활성화 함수와 사용자 정의 노드 및 계층의 수를 갖는 유연한 네트워크 아키텍처를 구축할 수 있습니다.
다른 유형의 기계 학습은 무엇입니까?
모두입니다! 우리는 RapidMiner 플랫폼의 일부로 수백 개의 다른 학습 알고리즘을 제공합니다. Python과 R과 같은 널리 사용되는 데이터 과학 프로그래밍 언어에서 적용할 수 있는 모든 것을 제공합니다. RapidMiner는 Naive Bayes, 회귀 such as Generalized Linear Models, 클러스터링 such as k-Means, FP-Growth, Decision Trees, Random Forests, Parallelized Deep Learning 및 Gradient Boosted Trees를 위한 방법을 제공합니다. 이러한 것들이 RapidMiner의 모델링 라이브러리의 일부이며 단일 클릭으로 사용할 수 있습니다.
Auto Model이 최적의 값을 사용하는 방법에 대해 논의할 수 있습니까?
RapidMiner AutoModel은 지능형 자동화를 사용하여 사용자가 모든 것을 가속화하고 정확하고健全한 모델을 구축할 수 있도록 합니다. 이는 인스턴스 선택 및 자동 아웃라이어 제거, 날짜 또는 텍스트와 같은 복잡한 데이터 유형에 대한 기능 엔지니어링, 및 완전한 다중 목적 자동 기능 엔지니어링을 포함합니다. 또한 데이터 클리닝 방법을 포함하여 데이터의 공통 문제를 수정하는 데 도움이 됩니다.
Auto Model은 또한 데이터 품질 메타 데이터를 추출합니다. 예를 들어, 열이 ID와 같은지 또는 누락된 값이 많은지 여부를 확인합니다. 이 메타 데이터는 기본 메타 데이터와 함께 자동화 및 사용자 지원을 위해 최적의 값을 사용하고 데이터 품질 문제를 처리하는 데 사용됩니다.
자세한 내용은 Auto Model 블루프린트에 모두 매핑했습니다. (추가적인 컨텍스트를 위한 이미지 아래)
자동화가 적용되는 4가지 기본 단계가 있습니다.
– 데이터 준비: 데이터의 공통 품질 문제를 식별하는 자동 데이터 분석, such as 상관관계, 누락된 값 및 안정성.
– 자동 모델 선택 및 최적화, 포함된 전체 검증 및 성능 비교, 이는 사용된 데이터에 대한 최상의 기계 학습 기술을 제안하고 최적의 매개 변수를 결정합니다.
– 모델 시뮬레이션으로 특정(사전적) 조치를 취하여 모델이 예측한 원하는 결과를 달성하는 데 도움이 됩니다.
– 모델 배포 및 운영 단계에서 사용자는 드리프트, 편향 및 비즈니스 영향과 같은 요인을 자동으로 표시합니다. 추가 작업이 필요 없습니다.

컴퓨터 편향은 모든 유형의 AI에서 문제입니다. 결과에 편향이 생기지 않도록 방지하기 위한 제어가 있습니까?
예, 이는จร로 데이터 과학에 매우 중요합니다. 이전에 언급한 거버넌스 기능은 사용자가 항상 모델 구축에 사용된 데이터를 확인하고 데이터 선택에 편향이 있는지 확인할 수 있도록 합니다. 추가로, 드리프트 감지 기능은 편향을 감지하는 또 다른 강력한 도구입니다. 프로덕션에서 모델이 입력 데이터에 많은 드리프트를 표시하는 경우, 이는 세계가 크게 변경되었음을 나타낼 수 있습니다. 그러나 이는 또한 훈련 데이터에 심각한 편향이 있었음을 나타낼 수 있습니다. 미래에, 우리는 다른 모델에서 편향을 감지할 수 있는 기계 학습 모델을 구축하는 것을 고려하고 있습니다.
RapidMiner AI Cloud와 그것이 경쟁 제품과 어떻게 차별화되는지에 대해 논의할 수 있습니까?
데이터 과학 프로젝트의 요구 사항은 크고 복잡하며 컴퓨팅 집약적일 수 있으며, 이는 데이터 과학자에게 클라우드 기술의 사용이 매력적인 전략으로 만들었습니다. 그러나 다양한 네이티브 클라우드 기반 데이터 과학 플랫폼은 특정 클라우드 벤더의 클라우드 서비스 및 데이터 저장소 제품에 사용자를 묶습니다.
RapidMiner AI Cloud는 단순히 RapidMiner 플랫폼의 클라우드 서비스 제공입니다. 이 제품은 고객의 환경에 맞게 맞춤화될 수 있습니다. 이는 현재 클라우드 데이터 관리에 대한 비즈니스 접근 방식이 매우 빠르게 발전하고 있는 상황에서 중요합니다. 유연성이 RapidMiner AI Cloud를 구별합니다. 이는 모든 클라우드 서비스, 프라이빗 클라우드 스택 또는 하이브리드 설정에서 실행할 수 있습니다. 우리는 클라우드 이식 가능, 클라우드 중립, 멀티 클라우드 – 당신이 원하는 것을 호출하십시오.
RapidMiner AI Cloud는 또한 매우 낮은 번거로움을 제공합니다. 당연히, 우리는 클라이언트가 비즈니스에 AI를 집중할 수 있도록 배포의 일부 또는 전부를 관리할 수 있는 기능을 제공합니다.甚至는 필요에 따라 단기 프로젝트를 위해 환경을 시작할 수 있는 온디맨드 옵션이 있습니다.
RapidMiner Radoop은 데이터 과학의 일부 복잡성을 제거합니다. 개발자에게 Radoop이 어떻게 도움이 되는지에 대해 논의할 수 있습니까?
Radoop은 주로 비-개발자가 빅데이터의 잠재력을 활용하고자 하는 사람들을 위해 설계되었습니다. RapidMiner Radoop은 코드가 없는 방식으로 Hadoop 내에서 RapidMiner 워크플로우를 실행합니다. 우리는 또한 Spark에 RapidMiner 실행 엔진을 임베드하여 코드 중심 접근 방식의 복잡성 없이 완전한 워크플로우를 Spark로 푸시할 수 있습니다.
정부 기관은 RapidMiner를 사용하여 데이터를 분석하여 잠재적인 전염병을 예측할 수 있습니까? BlueDot이 작동하는 방식과 유사하게?
일반적인 데이터 과학 및 기계 학습 플랫폼으로서, RapidMiner는 모델 생성 및 관리 프로세스를 스트림라인하고 향상시키기 위한 것입니다. 주제는 무엇이든 관계없이, 데이터 과학/기계 학습 문제의 중심에 있습니다. 우리의 초점은 전염병을 예측하는 것이 아닙니다. 그러나 올바른 데이터가 있다면, 주제 전문가(이 경우 바이러스학자 또는 역학자)는 플랫폼을 사용하여 전염병을 정확하게 예측할 수 있는 모델을 생성할 수 있습니다. 실제로 많은 연구자들이 RapidMiner를 사용하고 있으며, 우리의 플랫폼은 학술 목적으로 무료입니다.
RapidMiner에 대해 더 공유하고 싶은 것이 있습니까?
그것을 시도해 보세요! 데이터 과학이 얼마나 쉽게 될 수 있는지 그리고 좋은 플랫폼이 당신과 당신의 팀의 생산성을 얼마나 향상시킬 수 있는지驚訝할 것입니다.
이 훌륭한 인터뷰에 감사드립니다. 더 많은 정보를 배우고 싶은 독자는 RapidMiner를 방문해야 합니다.












