EMO lässt Mona Lisa singen

EMO lässt Fotos sprechen und singen. Das Forschungsprojekt EMO aus China lässt ein Foto (oder eine Grafik oder ein Gemälde wie der Mona Lisa) sprechen und singen. Die Mimik ist durchaus beeindruckend, die Lippenbewegungen nicht immer. Leider gibt es keine Möglichkeit, EMO selbst auszuprobieren.

Pika Lip-Sync

KI-Videogenerator Pika zeigt Sprachfunktion. Mit dem neuen „Lip Sync“-Feature lässt du Personen in deinen KI-Videos sprechen. Die Stimme wird entweder vorher aufgenommen oder mit der KI von Elevenlabs von einem Text erstellt. Die Funktion gibt es derzeit nur für zahlende „Pro“-Nutzer. Mehr dazu bei VentureBeat. 

Jamix integriert ChatGPT in Unternehmens-Tools

Jamix bringt ChatGPT ins Unternehmen. Das Startup will den Chat-Assistenten in die Tools integrieren, die Unternehmen bereits nutzen. Quelle: VentureBeat

Writer Palmyra-Vision bringt KI-gestützte Arbeitsabläufe zu Unternehmen

Writer Palmyra-Vision will KI-gestützte Arbeitsabläufe zu Unternehmen bringen. Die neue KI ist speziell für den Enterprise-Einsatz gedacht und „multimodal“: Es versteht also nicht nur Text als Input, sondern zum Beispiel auch Fotos und Scans. Quelle: VentureBeat

Wolf-Schneider-KI verbessert deine Texte

Mit der „Wolf-Schneider-KI“ kannst du deine deutschsprachigen Texte schnell verbessern. Interessanterweise bezahlst du hier keine monatliche Gebühr, sondern kaufst vorab Pakete mit einer bestimmten Zeichenanzahl.

Mistral Large ist ein GPT-4-Konkurrent aus Frankreich

Mistral hat bereits mit frei verfügbaren KI-Sprachmodellen auf sich aufmerksam gemacht. Mistral Large ist nun das leistungsfähigste Angebot, mit dem das französische Unternehmen auf OpenAIs GPT-4 abzielt. Eine Besonderheit ist seine Mehrsprachigkeit. So soll Mistral Large nicht nur auf Englisch gut funktionieren, sondern auch auf Französisch, Spanisch, Deutsch und Italienisch. Leider wird Mistral Large nicht …

Weiterlesen …

Ideogram verspricht bessere Texte in KI-Bildern

Texte sind bislang ein großes Problem für Bildgeneratoren. Am Anfang war es unleserliches Kauderwelches, später sah es zwar besser aus, ist aber noch immer voller Fehler und daher meist unbrauchbar. Ideogram verspricht mit seiner Version 1.0 Besserung. Unsere Tests zeigen: Es kann tatsächlich gut funktionieren, aber leider auch weiterhin nicht immer. Ideogramm kannst du kostenlos …

Weiterlesen …

Claude 3 will es mit GPT-4 aufnehmen

Anthropic hat mit Claude 3 die neueste Version seines KI-Sprachmodells vorgestellt. Sie kommen in drei Größen daher: Haiku, Sonnet, Opus. Das kleinste Angebot, Haiku, kommt später. Sonnet und Opus sind bereits verfügbar, allerdings weiterhin nicht im deutschsprachigen Raum. Das ist schade, denn in unseren Tests lieferten die beiden Claude-3-Varianten sehr gute Ergebnisse auf Deutsch.

Bildgenerator Stable Diffusion 3 angekündigt

Stability AI ist ein Anbieter zahlreicher KI-Werkzeuge, die mehr als andere auf eine offene Verfügbarkeit setzen. Unter dem Namen Stable Diffusion gibt es inzwischen eine umfangreiche Familie von Bildgeneratoren, die sich auch auf dem eigenen Rechner nutzen lassen. Das nun vorgestellte Stable Diffusion 3 verspricht für die Zukunft eine bessere Qualität. Das gilt vor allem …

Weiterlesen …

Nvidia Chat with RTX: Lokale KI

Ich hatte bereits das Konzept der „Local LLMs“ vorgestellt: KI-Assistenten vom Schlage eines ChatGPT, die aber nicht in der Cloud arbeiten, sondern auf deinem eigenen PC oder einem selbstbetriebenen Server. Eine Herausforderung ist dabei die Geschwindigkeit der Antworten. Nvidia hat nun „Chat with RTX“ vorgestellt, das die Rechenpower der hauseigenen Grafikkarten nutzt. Eine kostenlose Demo-App …

Weiterlesen …