Anthropic stärkt KI-Sicherheit: Neue Schutzmechanismen…

Anthropic hat den „Constitutional Classifier“ vorgestellt, um die missbräuchliche Nutzung von KI-Modellen zu verhindern. Diese Schutzschicht überwacht problematische Inhalte und soll illegale Anwendungen wie die Herstellung chemischer Waffen verhindern.

Die Einführung erfolgt, während Unternehmen wie Microsoft und Meta unter Druck stehen, ihre KI-Modelle gegen „Jailbreaking“ abzusichern. Microsoft führte im März 2024 den „Prompt Shield“ ein, Meta folgte im Juli mit einem verbesserten Schutzsystem.

Anthropic-Mitarbeiter Mrinank Sharma betont, dass das System flexibel auf neue Bedrohungen reagieren kann. Der „Constitutional Classifier“ basiert auf einem Regelwerk, das klar definiert, welche Inhalte erlaubt sind.

Um die Effektivität zu testen, bot Anthropic Prämien für Sicherheitsforscher an. Der Claude 3.5 Sonnet-Algorithmus blockierte über 95 Prozent der Angriffe, während die Ablehnungsrate nur um 0,38 Prozentpunkte stieg.

Die neuen Schutzmaßnahmen erhöhen jedoch die Betriebskosten. Der zusätzliche Rechenaufwand steigert die „Inference Overhead“-Kosten um rund 24 Prozent.

Sicherheitsexperten warnen, dass generative KI-Modelle gefährliche Informationen zugänglicher machen könnten. Ram Shankar Siva Kumar von Microsoft betont, dass heute auch unerfahrene Nutzer potenzielle Bedrohungen darstellen.

Quelle: Eulerpool Research Systems

Anthropic stärkt KI-Sicherheit: Neue Schutzmechanismen gegen Missbrauch

Aktuelle Posts

Deutschlands beste Aktienanalysen

Anthropic stärkt KI-Sicherheit: Neue Schutzmechanismen gegen Missbrauch

Aktuelle Posts

BAT treibt Gehaltswettlauf an Londons Börse mit neuem CEO-Vergütungspaket voran

ASIC fordert mehr Transparenz bei Privatdeals und warnt vor Risiken im australischen Finanzmarkt

Thames Water: Existenzielle Krise und drohender Zahlungsausfall

China verschärft Exportkontrollen: Auswirkungen auf globale Lieferketten und Investitionen

Match Group setzt auf KI zur Verbesserung des Online-Datings

Konkurrenz für die 'Magnificent Seven': KI-Newcomer und Sektorumschichtungen im Fokus

Satellitenkommunikation: Neue Chancen für Mobilfunkanbieter trotz Herausforderungen

KKR übertrumpft Bain: Fuji Soft-Übernahme zeigt Wandel im japanischen Private-Equity-Markt

TikToks Rückkehr in US-App-Stores: Rechtssicherheit für Apple und Google, aber ByteDances Zukunft bleibt ungewiss

EU Setzt Auf KI-Innovation Trotz US-Kritik: Lockerungen Bleiben Bestehen

AppLovin: Adtech-Riese mit beeindruckendem Kursanstieg – KKR verpasst Milliardenchance

Deutsche Bahn und EVG einigen sich auf Lohnsteigerungen und Beschäftigungssicherheit bis 2027

Deutschlands beste Aktienanalysen