KI & Daten

Bahnbrechende AI-Innovation: Motius & Roseman Labs vereinen RAG mit Encrypted Computing

Entdecken Sie, wie Motius und Roseman Labs die KI mit RAG und verschlüsseltem Computing revolutionieren. Ihr innovatives Proof-of-Concept ermöglicht einen sicheren, domänenspezifischen Datenabruf ohne Beeinträchtigung der Privatsphäre. Diese bahnbrechende Technologie eignet sich perfekt für Branchen wie Cybersicherheit, Gesundheitswesen und Strafverfolgung und gewährleistet leistungsstarke Erkenntnisse bei gleichzeitigem Schutz sensibler Daten. Erkunden Sie noch heute die Zukunft der datenschutzfreundlichen KI.

Januar 2025
8
min Lesezeit
Jan Wijma
Leiter der Produktabteilung @Roseman Labs
Diesen Beitrag teilen

Privacy Tech in Verbindung mit modernen KI-Funktionen ebnet den Weg für transformative Lösungen für die Herausforderungen des Datenaustauschs. Die Kombination von Informationsabfrage und -abgleich mit Verschlüsselung schafft die Grundlage für eine sichere Alternative zu ChatGPT, die die Suche und den Abruf sensibler Informationen unterstützt.

Roseman Labs, ein weltweit führendes Unternehmen für verschlüsseltes Computing aus den Niederlanden, und Motius, ein maßgebliches privates Forschungs- und Entwicklungsunternehmen aus Deutschland, haben kürzlich einen bahnbrechenden Proof of Concept (PoC) vorgeführt, der verschlüsseltes Computing mit Retrieval Augmented Generation (RAG) kombiniert.

RAG ist ein heißes Thema in der KI! Es verbessert die Qualität der Antworten, indem es der KI Zugang zu domänenspezifischen Inhalten gibt [1]. Die Integration modernster RAG-Technologien und verschlüsselter Datenverarbeitung ermöglicht es Unternehmen, sensible Informationsthemen abzufragen, ohne ihre Suche offenzulegen.

Im Rahmen des PoC haben Motius und Roseman Labs gemeinsam eine Pipeline entwickelt, die eine potenziell sensible (sicherheitsrelevante) Frage aufnahm und die Pipeline nutzte, um relevante Antworten in einem großen Datensatz des niederländischen National Cyber Security Center zu finden. Diese Pipeline stellte sicher, dass die Suchfrage und die Antwortunterstützung aus der Wissensdatenbank während des gesamten Prozesses geheim blieben.

Das Projekt zeigt auf, wie KI kritische Herausforderungen in regulierten Branchen wie der Strafverfolgung, der Hightech-Fertigung und dem Gesundheitswesen angehen kann, um bereichsspezifische Daten auf eine datenschutzfreundliche Weise zu nutzen.


Anwendungsfall: Minderung von Cybersecurity-Risiken für große Organisationen

Stellen Sie sich vor, der Chief Information Security Officer (CISO) einer wichtigen Organisation sieht sich mit einem dringenden Cybersicherheitsrisiko in einem ihrer Systeme konfrontiert. Der CISO bittet das National Cyber Security Center (NCSC) um Rat zu den besten Abhilfestrategien. Wenn er jedoch solch heikle Fragen offen stellt, könnte er sensible Informationen über seine potenziell gefährdeten Systeme preisgeben. In diesem Projekt wird untersucht, wie verschlüsseltes Computing es Organisationen ermöglicht, solche Fragen zu stellen, ohne sie der Öffentlichkeit preiszugeben.

Der Prozess beginnt mit der Einbettung der Frage des CISO in eine Vektordarstellung auf dessen eigenem System unter Verwendung eines lokal gehosteten, hochmodernen großen Sprachmodells (LLM). Diese Einbettung wird mit sicherer Mehrparteienberechnung (MPC) verschlüsselt und an eine sichere Matching-Engine des NCSC gesendet.

Die Engine identifiziert die relevantesten Dokumente aus dem NCSC-Repository, indem sie den verschlüsselten Vektor mit den Dokumenteneinbettungen vergleicht - ohne die Abfrage jemals zu entschlüsseln oder ihren Inhalt preiszugeben. Auf diese Weise werden die abgerufenen Dokumente an den CISO zurückgegeben oder an ein Sprachmodell weitergeleitet, das die Grundlage für eine Expertenberatung bildet. Im letzteren Fall generiert das Sprachmodell durch den zusätzlichen Kontext eine bessere Antwort.


Erfolg demonstrieren: Datenschutz, Genauigkeit und Skalierbarkeit

Die Zusammenarbeit zwischen Roseman Labs und Motius hat mehrere wichtige Meilensteine erreicht, deren Erfolg besonders wichtig ist, da Unternehmen zunehmend Daten gemeinsam nutzen und zusammenarbeiten.

  1. Stärkerer Datenschutz: Die Pipeline stellt sicher, dass sensible Abfragen und Dokumentenvergleiche durchgängig sicher sind. Damit wird den Datenschutzbedenken von Unternehmen in stark regulierten Branchen Rechnung getragen, die ihre sensiblen Daten nicht preisgeben wollen.
  1. Genaues Auffinden von Dokumenten: Unter Verwendung der Kosinusdistanz unter Verschlüsselung - auch als Fuzzy-Matchingbezeichnet -zeigte dasProjekt eine hohe Genauigkeit bei der Identifizierung relevanter Dokumente. Dies gilt sogar für einen großen Korpus, sofern die Rechenleistung ausreicht.
  1. Skalierbarkeit: Die Lösung hat bewiesen, dass verschlüsselte Datenverarbeitung Abfragen in natürlicher Sprache verarbeiten kann, was sie für reale Anwendungen relevant macht.


Die Rolle der RAG und der sich entwickelnde Datenstapel

Das Projekt steht im Einklang mit den Trends des modernen Datenstapels, bei dem drei kritische Ebenen angesprochen werden.  

  • LLMs stärken die semantische Oberschicht und ermöglichen den Menschen die Interaktion mit Daten in natürlicher Sprache.
  • Auf der untersten Ebene des Datenstapels erweitern grundlegende LLMs, RAG und größere Kontextfenster den Anwendungsbereich und die Genauigkeit der KI für domänenspezifische Anwendungen.
  • Schließlich erstreckt sich der Datenstapel über die Partner im breiteren Ökosystem und betrifft die laterale Ebene für die Datenzusammenarbeit. Das EU-Konzept der Datenräume ist ein gutes Beispiel dafür [2]. Roseman Labs hat den Begriff verschlüsselte Datenräume für eine sichere Zusammenarbeit zwischen Organisationen geprägt, die durchgängig verschlüsselt bleibt [3].  

RAG entwickelt sich zu einer Schlüsselfähigkeit und ist eine wichtige Funktion zur Verbesserung der KI, indem die größeren Kontextfenster moderner LLMs genutzt werden, um relevante Dokumente dynamisch einzubetten und abzurufen.


Transformative Wirkung für Regierung und Industrie

Die Auswirkungen dieses Projekts gehen weit über die Cybersicherheit hinaus und bieten Vorteile für alle regulierten Branchen.

In der Strafverfolgung ist die sichere Analyse sensibler Informationen über Behörden hinweg ohne Beeinträchtigung der betrieblichen Vertraulichkeit von großer Bedeutung. Zum Beispiel der Abgleich verschlüsselter Verbrechensdaten in verschiedenen Gerichtsbarkeiten, um Muster aufzudecken.

Im Gesundheitswesen müssen Krankenhäuser und Forscher zusammenarbeiten, ohne sensible Patientendaten preiszugeben. Die Anbieter benötigen eine Plattform für den sicheren Austausch klinischer Daten, um Forschung und Behandlungsqualität zu verbessern.  

Stellen Sie sich einen Patienten vor, der Fragen zu einem bestimmten Gesundheitsproblem hat, das er seinem Arzt nicht direkt stellen möchte (z. B. sexuelle Gesundheit), aber dennoch relevante Informationen erhalten möchte. Sie können die Frage vertraulich über die sichere Plattform stellen und erhalten Antworten auf der Grundlage öffentlich zugänglicher Daten in einer leicht zugänglichen Form.  

In der Hightech-Fertigung kann die sichere Analyse von Risiken in der Lieferkette und von geistigem Eigentum neue Erkenntnisse liefern. Hersteller können verschlüsselte Daten über Produktionsengpässe oder Cyber-Bedrohungen sicher austauschen und analysieren. Darüber hinaus können Halbleiterfabriken die Produktausbeute und -qualität optimieren, indem sie die Maschinenparameter in der gesamten Liefer- oder Produktionskette feinabstimmen.

Für Datenanalyseteams, die Tools für diese Sektoren entwickeln, bietet diese Lösung einen klaren Plan für die Integration von verschlüsselter KI in den modernen Datenstack. Durch die Nutzung von RAG und verschlüsseltem Computing können Unternehmen leistungsstarke Erkenntnisse gewinnen und gleichzeitig sensible Daten schützen.


Der Weg nach vorn

Dieses Projekt ist ein Beweis für das Potenzial der verschlüsselten KI zur Bewältigung realer Herausforderungen. Mit der Weiterentwicklung größerer Kontextfenster und verschlüsselter Datenverarbeitung werden die Möglichkeiten für eine sichere branchenübergreifende Zusammenarbeit weiter zunehmen. Für Regierungen und Unternehmen, die sich in komplexen Datenschutzlandschaften bewegen, stellen solche Verschlüsselungslösungen nicht nur eine technologische Innovation dar, sondern auch einen grundlegenden Wandel in der Art und Weise, wie wir über Vertrauen, Sicherheit und Zusammenarbeit im Zeitalter der KI denken.


[1] https://en.wikipedia.org/wiki/Retrieval-augmented_generation  

[2] https://digital-strategy.ec.europa.eu/en/policies/data-spaces  

[3] https://rosemanlabs.com/en/blogs/eu-vision-of-data-spaces-happening-in-the-netherlands

Bereit durchzustarten?

Lass uns austauschen und gemeinsam ein Projekt beginnen.

Arbeiten in einem Technologieunternehmen | Motius