Google integriert Echtzeit-Suche in Gemini AI Plattform

Google hat für seine Gemini AI Plattform die Funktion „Grounding with Google Search“ eingeführt. Sie ermöglicht es Entwicklern, ihre KI-Anwendungen mit aktuellen Informationen aus der Google-Suche anzureichern. Der Dienst wurde nur wenige Stunden vor OpenAIs verbraucherorientierter ChatGPT-Suche gestartet, wie Michael Nuñez von VentureBeat berichtet. Googles Angebot richtet sich an Entwickler und kostet 35 US-Dollar pro …

Weiterlesen …

Anthropic veröffentlicht Claude 3.5 Haiku mit höheren Preisen

Das Unternehmen Anthropic hat sein neuestes und kleinstes KI-Modell Claude 3.5 Haiku veröffentlicht. Laut Anthropic übertrifft es das vorherige Flaggschiff-Modell Claude 3 Opus bei verschiedenen Benchmarks zu einem niedrigeren Preis. Allerdings hat Anthropic die Preise für Claude 3.5 Haiku erhöht, um die verbesserten Fähigkeiten widerzuspiegeln. Eingabe-Token kosten jetzt 1 Dollar pro Million und Ausgabe-Token 5 …

Weiterlesen …

KI lernt, wann externe Werkzeuge sinnvoll sind

Forscher der University of California San Diego und der Tsinghua University haben eine Methode entwickelt, die die Fähigkeit künstlicher Intelligenz verbessert, zu erkennen, wann der Einsatz externer Werkzeuge sinnvoller ist als sich auf integriertes Wissen zu verlassen. Ähnlich wie menschliche Experten lernt die KI, Probleme nach ihrer Komplexität zu kategorisieren und entsprechend Werkzeuge einzusetzen oder …

Weiterlesen …

KI-gestützte Suche von OpenAI überzeugt noch nicht als Google-Alternative

Die von OpenAI entwickelte KI-Suchmaschine ChatGPT Search bietet zwar einen faszinierenden Einblick in die Zukunft der Websuche, hat jedoch noch Schwierigkeiten mit kurzen, navigationsbezogenen Anfragen. Diese machen den Großteil der Suchanfragen bei Google aus, wie Maxwell Zeff in einem eintägigen Test feststellte. ChatGPT Search liefert bei längeren, recherche-orientierten Fragen durch das Durchsuchen mehrerer Websites präzise …

Weiterlesen …

ChatGPT erhält Echtzeit-Suchfunktionen

OpenAI hat eine Web-Suchfunktion in sein Conversational AI-System ChatGPT integriert. Die neue Funktion, die zunächst für zahlende Abonnenten verfügbar ist, ermöglicht es ChatGPT, das Web zu durchsuchen und Echtzeit-Informationen zu Themen wie Nachrichten, Sport, Aktien und Wetter bereitzustellen. Durch kuratierte Antworten mit klarer Quellenangabe zielt ChatGPT darauf ab, Nutzern eine natürlichere und effizientere Möglichkeit zu …

Weiterlesen …

OpenAI erweitert Realtime-API um neue Stimmen und senkt Preise für Entwickler

OpenAI hat seine Realtime-API, die sich derzeit in der Beta-Phase befindet, um fünf neue ausdrucksstarke Stimmen für Speech-to-Speech-Anwendungen erweitert. Durch die Einführung von Prompt-Caching wurden die Kosten für Entwickler gesenkt. Laut der von VentureBeat zitierten API-Dokumentation von OpenAI ermöglicht die native Speech-to-Speech-Funktion eine geringe Latenz und nuancierte Ausgaben. Das Unternehmen präsentierte drei der neuen Stimmen …

Weiterlesen …

Moondream entwickelt kompaktes KI-Modell für Bild- und Spracherkennung

Das Startup Moondream hat in einer Pre-Seed-Finanzierungsrunde 4,5 Millionen US-Dollar eingeworben. Das Unternehmen hat ein quelloffenes Modell für Bild- und Spracherkennung entwickelt, das mit nur 1,6 Milliarden Parametern auskommt. Dennoch erreicht es laut CEO Jay Allen eine Leistung, die mit viermal größeren Modellen vergleichbar ist. Der Ansatz von Moondream ermöglicht den lokalen Einsatz von KI-Modellen …

Weiterlesen …

Read AI sammelt 50 Millionen Dollar in Series-B-Finanzierung

Das KI-Startup Read AI hat in einer Series-B-Finanzierungsrunde unter der Leitung von Smash Capital 50 Millionen Dollar eingeworben. Dies geschieht nur sechs Monate nach einer Series-A-Finanzierung in Höhe von 21 Millionen Dollar. Laut Mitbegründer David Shim verzeichnete das Unternehmen seit der letzten Finanzierungsrunde ein starkes Wachstum mit über 100.000 neuen Konten. Read AI plant, die …

Weiterlesen …

Open-Source-Toolkit Amphion unterstützt Forschung zu Audio-, Musik- und Sprachgenerierung

Das quelloffene Toolkit Amphion dient der Unterstützung von Forschung und Entwicklung im Bereich der Audio-, Musik- und Sprachgenerierung. Laut Projekt-Website bietet es einzigartige Visualisierungen klassischer Modelle und Architekturen, um Nachwuchsforscher*innen und Ingenieur*innen das Verständnis zu erleichtern. Amphion unterstützt verschiedene Generierungsaufgaben wie Text-to-Speech (TTS), Gesangsstimmensynthese (SVS), Stimmkonvertierung (VC), Gesangsstimmenkonvertierung (SVC), Text-to-Audio (TTA) und Text-to-Music (TTM). Zudem …

Weiterlesen …

Nützliches KI-Modell beschleunigt Spracherkennung bei hoher Genauigkeit

Das auf die Verbesserung der Mensch-Maschine-Kommunikation spezialisierte KI-Unternehmen Useful hat Moonshine als Open-Source-Modell veröffentlicht. Es soll die Latenzzeit von Sprachschnittstellen erheblich reduzieren und gleichzeitig die Genauigkeit von OpenAIs Whisper-Modell erreichen oder übertreffen. Laut Useful-Gründer Pete Warden liefert Moonshine Ergebnisse 1,7-mal schneller als Whisper. Dank des variablen Eingabefensters verarbeitet es kurze Audioclips fünfmal schneller. Der geringe …

Weiterlesen …