Interviews

Or Lenchner, CEO von Bright Data – Interview-Serie

mm

Or Lenchner, CEO von Bright Data, leitet seit 2018 die marktführende Plattform für Web-Daten-Sammlung und hat deren Expansion, Innovation und Wachstum auf über 100 Millionen US-Dollar Umsatz pro Jahr vorangetrieben. Bright Data ermöglicht es Fortune-500-Unternehmen, führenden Unternehmen, renommierten Universitäten und öffentlichen Einrichtungen, auf öffentliche Web-Daten in Echtzeit und im großen Maßstab zuzugreifen. Lenchner ist ein starker Befürworter der Offenheit und Zugänglichkeit öffentlicher Web-Daten und betont ihre entscheidende Rolle bei der Förderung von Innovation.

Was hat Sie dazu inspiriert, in die Welt der Daten und KI zu gehen, und wie haben Sie seit Ihrem Amtsantritt als CEO 2018 die Mission und Vision von Bright Data geprägt?

Ich bin immer von der Macht der Daten fasziniert gewesen, insbesondere davon, wie sie Entscheidungen beeinflussen und Innovationen vorantreiben können. Wenn man sie richtig nutzt, können Daten auch Transparenz in Unternehmen fördern. Als CEO von Bright Data seit 2018 hatte ich die Gelegenheit, die Art und Weise zu prägen, wie KI-Forscher und Unternehmen öffentliche Web-Daten sammeln und nutzen.

Welche Herausforderungen stellen sich KI-Teams bei der Beschaffung großer Mengen öffentlicher Web-Daten und wie löst Bright Data diese Probleme?

Skalierbarkeit bleibt eine der größten Herausforderungen für KI-Teams. Da KI-Modelle enorme Mengen an Daten erfordern, ist die effiziente Sammlung keine leichte Aufgabe. Und da KI-Modelle nur so gut sind wie die Daten, auf denen sie trainiert werden, ist es eine ständige Herausforderung, Teams den Zugang zu frischen, hochwertigen Daten zu ermöglichen. Dies gilt insbesondere, da das Web in Echtzeit evolviert.

Ein weiteres großes Anliegen ist die Einhaltung von Vorschriften. Datenschutzgesetze und -anforderungen ändern sich ständig, so dass KI-Teams immer auf dem neuesten Stand sein müssen. Sie müssen auch verstehen, wie sie mit Webseiten umgehen, die Anti-Bot-Mechanismen einsetzen, was die Datensammlung komplizieren kann.

Die Plattform, die wir bei Bright Data entwickelt haben, löst diese Probleme. Wir bieten skalierbare, automatisierte Datensammlung, die strukturierte Echtzeit-Daten liefert. Unsere KI-gesteuerten Tools reinigen und validieren Daten, um Genauigkeit zu gewährleisten. Wir haben strenge Maßnahmen ergriffen, um sicherzustellen, dass die Datensammlung rechtskonform und ethisch ist. Ziel ist es, KI-Teams zu ermöglichen, sich auf die Entwicklung großartiger Modelle zu konzentrieren, während wir die Komplexität der Datensammlung übernehmen.

Wie tragen hochwertige Web-Daten zur Leistung von KI-Modellen bei und welche sind die besten Praktiken, um die Genauigkeit der Daten zu gewährleisten?

Hochwertige Daten sind Daten, die vollständig, frei von Voreingenommenheit und vor allem genau sind. Wenn Daten unvollständig oder von Fehlern und Inkonsistenzen durchzogen sind, wird das KI-Modell nicht den Erwartungen entsprechen.

Um Genauigkeit zu erreichen, ist es am besten, Daten aus einer Vielzahl öffentlicher Quellen zu sammeln, die als zuverlässig gelten. Die Verwendung nur weniger oder schlimmstenfalls einer einzigen Datenquelle führt zu Problemen wie Unvollständigkeit. Durch die Nutzung mehrerer Quellen kann man Daten kreuzvalidieren und ein ausgewogeneres und repräsentativeres Datenset aufbauen. Zusätzlich sollten Organisationen automatisierte Datenvalidierung und -reinigung in Betracht ziehen, um effizient fehlerhafte und inkonsistente Daten zu entfernen.

Bei Bright Data berücksichtigen wir all diese Faktoren. Wir stellen KI-Teams strukturierte und Echtzeit-Daten zur Verfügung, die auf Genauigkeit validiert wurden. Damit können sie Modelle mit Vertrauen trainieren.

Welche sind die größten ethischen Bedenken bei der Sammlung öffentlicher Web-Daten heute?

Der Datenschutz bleibt eines der größten Anliegen bei der Sammlung öffentlicher Web-Daten. Menschen sorgen sich um die Offenlegung ihrer Daten und deren möglichen Missbrauch. Um sicherzustellen, dass Daten privat bleiben, ist es wichtig, Transparenz zu betonen. Organisationen, die Daten sammeln, müssen offenlegen, welche Daten sie sammeln. Es ist wichtig, der Öffentlichkeit zu versichern, dass ihre Daten unter strengen ethischen Richtlinien verwendet werden.

Ein weiteres großes Anliegen ist die Monopolisierung. Bestimmte große Unternehmen kontrollieren große Mengen an Daten, was zu einem ungleichen Wettbewerb führt, bei dem nur wenige Zugang zu den Informationen haben, die notwendig sind, um KI-Modelle zu trainieren und Innovationen voranzutreiben. So sollte es nicht sein. Öffentliche Web-Daten sollten für Unternehmen, Forscher und Entwickler zugänglich bleiben. Damit wird die KI-Entwicklung nicht auf die Hände weniger großer Spieler konzentriert.

Ethik ist bei Bright Data kein Nachgedanke, sondern ein integraler Bestandteil aller Entscheidungen. Wir folgen nicht nur den Branchenstandards – wir setzen sie. Wir sind Vorreiter in der Daten-Sammlungs-Industrie bei der Definition der richtigen ethischen Standards. Wir wollen sicherstellen, dass öffentliche Web-Daten verantwortungsvoll, transparent und im Einklang mit globalen Vorschriften zugänglich gemacht werden.

Wie stellt Bright Data sicher, dass es globalen Datenschutzvorschriften entspricht und gleichzeitig große Mengen an Daten sammelt?

Unser Unternehmen ist verpflichtet, globalen Rechts- und Regulierungsvorschriften für die Datensammlung und -nutzung zu entsprechen. Wir stellen sicher, dass wir die Anforderungen der DSGVO, CPRA, CCPA und anderer relevanten Vorschriften erfüllen. Wichtig ist, dass wir streng die Know-Your-Customer-Protokolle (KYC) einhalten, um sicherzustellen, dass nur legitime Nutzer Zugang zu unserer Plattform erhalten. Unsere Datenlösungen dürfen nur von legitimen Unternehmen und Forschern genutzt werden.

Unsere Akzeptanzrichtlinie definiert klar, welche Daten gesammelt werden dürfen und welche nicht. Dazu gehört auch die verantwortungsvolle Nutzung. Wir haben ein dediziertes Compliance-Team, das sich um die kontinuierliche Überwachung von Vorschriften kümmert, um sicherzustellen, dass wir immer auf dem neuesten Stand sind.

Trotzdem glauben wir, dass öffentliche Web-Daten zugänglich bleiben sollten. Unser Ziel ist es, KI-Teams mit den Daten zu versorgen, die sie benötigen, während wir gleichzeitig die Einhaltung von Datenschutz- und Rechtsvorschriften sicherstellen.

Wie balancieren Sie Geschäftswachstum mit der Einhaltung ethischer Datensammlungspraktiken?

Wir denken, dass Ethik und Wachstum nicht gegensätzlich sind. Das Vertrauen unserer Kunden und die Beziehung, die wir mit ihnen aufbauen, sind für uns von größter Bedeutung. Wir verstehen, dass wir nur langfristig erfolgreich sein können, wenn wir Daten unter transparenten Bedingungen und im Einklang mit den geltenden Gesetzen sammeln.

Daher haben wir ein strenges Überprüfungsverfahren für unsere Nutzer eingerichtet, um sicherzustellen, dass die gesammelten Daten ethisch verwendet werden. Wir investieren Zeit, Mühe und Ressourcen in Compliance und Sicherheit, um unsere Kunden und die Öffentlichkeit zu schützen. Durch die Einhaltung ethischer Datensammlungspraktiken können wir geschäftlich erfolgreich sein und gleichzeitig zu einem transparenten und verantwortungsvollen KI-Ökosystem beitragen.

Wie bleibt Bright Data auf dem Laufenden bei regulatorischen Änderungen im Datenschutz?

Wir verstehen, dass unsere Datennutzungsprozesse und -richtlinien sich unweigerlich ändern müssen, um Änderungen in den relevanten Gesetzen und Vorschriften Rechnung zu tragen. Als solches konsultieren wir regelmäßig Rechtsexperten und kommunizieren mit Regulierungsbehörden. Wir nehmen auch an Diskussionen mit Gesetzgebern und anderen an der Politikgestaltung Beteiligten teil, um sinnvolle Datenschutzvorschriften zu gestalten. Wir zielen darauf ab, eine Balance zwischen Innovation und Datenschutz zu schaffen.

Unser Daten-Sammlungs- und -Nutzungs-Framework entwickelt sich mit neuen Gesetzen und geänderten Vorschriften weiter. Wir haben ein Compliance-Team, das unsere Datennutzungs-Richtlinien proaktiv aktualisiert, um sicherzustellen, dass unsere Plattform immer vollständig konform ist. Darüber hinaus führen wir Kunden-Bildungsinitiativen durch, um ethische Datennutzung zu fördern.

Welche Trends in der KI-Datensammlung sollten Unternehmen beachten?

Die Echtzeit-Datensammlung wird für heutige KI-Modelle immer wichtiger. Es ist entscheidend, dass sie Zugang zu den neuesten oder frischesten Daten haben, um eine hohe Genauigkeit zu liefern und bessere Benutzererfahrungen zu bieten.

Ein weiterer bemerkenswerter Trend ist die zunehmende Verwendung synthetischer Daten für die Daten-Augmentation, bei der KI Daten generiert, die Datensätze aus realen Szenarien ergänzen.

Ich sehe auch ein starkes Interesse an der Entwicklung von erklärbarer KI. Die meisten KI-Modelle leiden derzeit unter dem “Black-Box-Effekt”, also dem Mangel an Transparenz in ihren Entscheidungsprozessen. Unternehmen versuchen, dieses Paradigma zu ändern, indem sie KI-Modelle entwickeln, die erklären können, wie sie zu ihren Ausgaben oder Entscheidungen gekommen sind.

Zuletzt sind Unternehmen sich der wachsenden Datenschutz-Bedenken bewusst. Deshalb werden KI-Techniken, die den Datenschutz schützen, wie das federierte Lernen, immer gefragter. Organisationen möchten ihre KI-Modelle trainieren, ohne die Privatsphäre der Nutzer zu gefährden.

Wir stellen sicher, dass wir auf dem Laufenden sind, um Lösungen zu entwickeln, die es KI-Teams ermöglichen, ihre Wettbewerbsfähigkeit zu erhalten.

Wie sehen Sie die Zukunft der KI-gesteuerten Agenten und der Automatisierung in der Datensammlung?

Derzeit nutzen KI-Modelle in der Regel strukturierte Datensätze, die hauptsächlich manuell gesammelt werden. Diese Datensätze werden auch vorverarbeitet, gereinigt und durchlaufen andere Verfahren, die in der Regel menschliche Eingriffe erfordern. Dies wird sich in naher Zukunft mit dem Aufkommen von KI-Agenten für die autonome Sammlung und Verarbeitung von Daten für die KI-Schulung ändern. Sie ermöglichen es, in bisher ungekanntem Umfang aus Echtzeit-Web-Daten zu lernen.

Wir haben Infrastrukturen geschaffen, die die Bereitstellung und Entwicklung von KI-Agenten unterstützen, um einen reibungslosen Zugang zu hochwertigen Echtzeit-Web-Daten zu ermöglichen. Diese Technologie ermöglicht es komplexen KI-Systemen, kontinuierlich mit dynamischen Web-Daten zu interagieren, daraus zu lernen und zu wachsen.

KI-Agenten können Branchen revolutionieren, indem sie es KI-Systemen ermöglichen, auf ständig wechselnde Datensätze im Web zuzugreifen und daraus zu lernen, anstatt auf statische und manuell verarbeitete Daten angewiesen zu sein. Dies kann beispielsweise zu KI-gesteuerten Chatbots im Bank- oder Cybersicherheitsbereich führen, die in der Lage sind, Entscheidungen zu treffen, die die aktuellsten Realitäten widerspiegeln. Dies führt zu enormen Effizienzsteigerungen und mehr Automatisierungsmöglichkeiten.

Bei Bright Data treiben wir nicht nur diese Transformation in der Datensammlungs-Landschaft voran. Wir glauben, wir sind an der Spitze, indem wir eine Technologie einführen, die die nächste Generation der künstlichen Intelligenz einleitet. Wir sind begeistert, Unternehmen und KI-Teams dabei zu unterstützen, das volle Potenzial von KI-Agenten für ihre Betriebe zu nutzen.

Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten Bright Data besuchen.

Antoine ist ein visionärer Leader und Gründungspartner von Unite.AI, getrieben von einer unerschütterlichen Leidenschaft für die Gestaltung und Förderung der Zukunft von KI und Robotik. Als Serienunternehmer glaubt er, dass KI für die Gesellschaft so disruptiv sein wird wie Elektrizität, und er wird oft dabei erwischt, wie er über das Potenzial disruptiver Technologien und AGI schwärmt.

Als Futurist ist er darauf fokussiert, zu erkunden, wie diese Innovationen unsere Welt prägen werden. Zusätzlich ist er der Gründer von Securities.io, einer Plattform, die sich auf Investitionen in hochmoderne Technologien konzentriert, die die Zukunft neu definieren und ganze Branchen umgestalten.