KI-Newsletter – 01.04.2025

KI-Kosmos im Schnelldurchlauf – News & Updates von Gemini 2.5 bis Runway Model 4!

1. OpenAI: Neuer Bildgenerator – top Leistung, aber limitierte Nutzung

OpenAIs neuestes Bilderzeugungs-Modell beeindruckt mit verblüffend guter Qualität – Text auf Schildern, fotorealistische Details, Studio Ghibli ähnliche Bilder, alles machbar. Die Kehrseite: Schon kurz nach dem Start musste OpenAI auf die Bremse treten. CEO Sam Altman scherzte, die GPUs würden „schmelzen“, und kündigte temporäre Limits an. Im Gratis-Tarif sind Nutzer bald auf drei Bildgenerierungen pro Tag beschränkt​. Hintergrund sind explodierende Anfragen, denn das Modell (in GPT-4o integriert) befolgt Anweisungen extrem genau und kann sogar Texte glaubwürdig ins Bild setzen​. Fazit: Hier hat OpenAI ein heißes Eisen im Feuer – so heiß, dass man sich die Finger (bzw. Server) verbrennt.

2. Gemini 2.5 Pro: Googles neues KI-Modell zündet den Turbo

Google DeepMind schickt mit Gemini 2.5 Pro seinen bisher schlausten KI-Kandidaten ins Rennen – und das sogar gratis zum Ausprobieren. Das Modell „denkt mit“ und zeigt herausragende Fähigkeiten in Logik und Coding​. In Benchmarks stürmt es an die Spitze: Menschliche Tester bevorzugen Gemini 2.5 deutlich vor anderen (Platz 1 auf LMArena) und es erzielt 18,8 % im kniffligen „Humanity’s Last Exam“​. Außerdem kann es irre viel Kontext verarbeiten: rund eine Million Tokens – mehr Wörter als die komplette Herr der Ringe-Trilogie​! Mit diesem gigantischen „Gedächtnis“ und starken Programmier-Skills positioniert sich Gemini 2.5 Pro als ernstzunehmender Herausforderer für GPT-4 & Co; während Entwickler staunen, dass so viel Leistung aktuell gratis zu haben ist.

Quelle: revolgy.com

3. Unterwasser-Rechenzentrum in China: Technik taucht ab (im wahrsten Sinne)

In China wurde das erste kommerzielle Unterwasser-Rechenzentrum fertiggestellt. Vor der Küste Hainans senkten Ingenieure tonnenschwere, wasserdichte Module in 30 Meter Tiefe auf den Meeresboden​. Der Vorteil dieser Tauchstation: Kühlung durch Meerwasser spart gigantische Energiemengen – geschätzt 122 Mio. kWh jährlich – Bei dem deutschen Strompreis wären das knapp 33 Mio. €​. Das Rechenzentrum soll 25 Jahre im Ozean laufen und entspricht der Leistung Zehntausender normaler Computer. Doch es gibt Tücken: Salzwasser ist korrosiv, wie oft Teile ausgetauscht werden müssen, bleibt abzuwarten​. Auch die Auswirkungen auf Meeresflora und -fauna sind kaum erforscht​. Trotzdem: Das Projekt ist ein visionärer Schritt – mit ordentlich Tiefgang in Sachen grüner IT.

4. DeepSeek V3: Großes Update – Chinas KI-Herausforderer rüstet auf

Der chinesische KI-Newcomer DeepSeek macht weiter Tempo: Version 3 seines großen Sprachmodells hat ein Upgrade (Codename V3-0324) erhalten. Die neue Version verbessert insbesondere logisches Denken und Programmierfähigkeiten deutlich​ – Benchmark-Tests zeigen in vielen Kategorien einen Sprung nach vorn. DeepSeek positioniert sich damit als ernstzunehmender globaler Player und bietet westlichen Modellen Paroli, oft bei geringerem Ressourcenaufwand​. In Europa könnten wir die Open-Source-Lizenz von Deepseek nutzen und selbst an relevanz in diesem Themengebiet gewinnen.

5. Europa-Filter: Jetzt gezielt nach KI-Alternativen „Made in EU“ suchen

US-KI oder doch lieber datenschutzfreundliche Euro-Alternative? Auf unserer Plattform (Alles-KI.com) können Nutzer*innen nun gezielt nach europäischen bzw. deutschen KI-Lösungen filtern. Der Hintergrund: Viele Unternehmen und Behörden wünschen sich „digitale Souveränität“ – KI-Dienste, bei denen Serverstandort und Datenschutz europäischen Standards entsprechen​. Der neue Filter macht genau das einfacher und zeigt, dass „KI made in Europe or Germany“ kein leeres Versprechen ist.
Der Nutzen: Nutzer finden schneller lokale Alternativen, die ihren Anforderungen an Datenschutz und Sprache gerecht werden – Motivation genug, Big Tech ein Stückchen Unabhängigkeit abzutrotzen.

6. Sprachassistent Sesame geht Open Source

„Sesam öffne dich!“ – dieses Kommando hat das Startup Sesame wörtlich genommen und den Quellcode seines KI-Sprachmodells freigegeben. Konkret hat Sesame das CSM-1B (Conversational Speech Model) – die KI-Stimme hinter dem virtuellen Assistenten Maya – als Open Source veröffentlicht​. Bisher war Maya ein proprietärer Voice-Bot, der mit verblüffend natürlicher Sprachausgabe (inklusive Atmern und Ähms) viral ging. Durch den offenen Schritt können Entwickler das Basismodell nun frei nutzen und verbessern. Das bedeutet mehr Transparenz und Innovationsschub in der Sprach-KI – birgt aber auch Risiken: Das Modell kommt praktisch ohne eingebaute Sicherungen, und Stimmenklonen gelingt damit in Sekunden​. Die Macher appellieren an eine verantwortungsvolle Nutzung​. Unterm Strich ist Sesame’s Open-Source-Offensive ein spannender Schritt: Sie demokratisiert hochrealistische Sprachsynthese.

7. OpenAI FM: Neue Speech-to-Text-KI – was ist das Ziel, was anders als Whisper?

OpenAI schickt ein Upgrade für seine Spracherkennung ins Rennen, intern gern „OpenAI FM“ genannt. Das neue Modell (offiziell GPT-4o-transcribe) soll OpenAIs bislang offene Lösung Whisper ablösen. Dabei liegt der Fokus auf Präzision und Tempo: Die Wortfehlerrate wurde deutlich gesenkt und schlägt selbst Whisper v2 und v3​. Akzente, Hintergrundlärm oder schnelles Sprechen bringen OpenAIs neue Transkription kaum noch aus der Ruhe​. Besonders beeindruckend: In Englisch erreicht das System nur noch ~2,5 % Fehlerquote​. Technisch neu sind Features wie integrierte Rauschunterdrückung und eine semantische Pause-Erkennung, die erkennt, wann ein Sprecher fertig ist​.

8. OpenAI unterstützt MCP – gemeinsame Standards und Model Spec für bessere KI-Governance

In der KI-Welt tut sich was in Sachen Standardisierung und Governance. OpenAI überrascht diese Woche mit der Unterstützung für MCP (Model Context Protocol) – einem offenen Standard, den Konkurrent Anthropic entwickelt hat​. MCP ist quasi der „USB-C-Port“ für KI-Modelle: Ein einheitliches Protokoll, damit KI-Assistenten sicher und einheitlich auf externe Tools, Datenquellen und Apps zugreifen können​. OpenAIs Zusage, MCP in eigene Produkte wie den ChatGPT-Client zu integrieren, zeigt: Kooperation gewinnt über Konkurrenz, wenn es um sinnvolle Infrastruktur geht​.

9. REVE: Neues Bildmodell fordert Midjourney & Co. heraus

Ein frischer Herausforderer betritt die Bühne der Bildgeneratoren: Reve Image 1.0. Das kalifornische Startup Reve AI hat sein erstes KI-Bildmodell vorgestellt. Reve glänzt mit hoher Prompt-Treue, starkem Sinn für Ästhetik und einer Fähigkeit, an der andere scheitern: Es kann Schrift im Bild klar und lesbar darstellen​. Ob Logos oder Straßenschilder. Außerdem lässt sich bestehendes Bildmaterial per Texteingabe bearbeiten, und Referenzbilder können als Stilvorlage dienen​. Erste Tests zeigen, dass Reve 1.0 qualitativ ganz vorne mitmischt: In einem Benchmark (Image Arena) belegt es Platz 1 in Sachen Bildqualität​ – vor Branchenstars wie Midjourney v6.1 und Googles Imagen.

Von Reve erstellt

10. Runway Model 4: Neuer Booster für KI-generierte Videos

Runway legt nach: Mit Model 4 bringt das Team hinter dem beliebten Kreativ-Tool ein waschechtes Upgrade für die Welt des KI-Video-Editings. Das Besondere? Dank neuester Generative-Video-Technologien lassen sich ganze Filmszenen per Textprompt ins Leben rufen – komplett animiert, in (fast) beliebiger Stilrichtung und erstaunlich realistisch.

Quelle: techcrunch

Bilderrätsel

Auflösung letzter Woche:

KI generiert

Neues Bilderrätsel

Welches ist diese Mail durch KI erzeugt?

Bild 1

Bild 2

KI-Meme der Woche

Generiert mit hailuo ai

Danke für deine Aufmerksamkeit!

Bis zur nächsten Woche.

Reply

or to participate.