close
close

topicnews · August 26, 2024

Viggle AI schließt 26 Millionen CAD-Finanzierungsrunde der Serie A ab, um KI-gestützten Videogenerator zu erweitern

Viggle AI schließt 26 Millionen CAD-Finanzierungsrunde der Serie A ab, um KI-gestützten Videogenerator zu erweitern

Das Torontoer Startup, das hinter dem viralen Lil Yachty-Walkout-Meme steht, heizt sein Wachstum an.

Das in Toronto ansässige Startup für generative künstliche Intelligenz (KI) Viggle AI hat sich im Rahmen der Serie-A-Finanzierungsrunde fast 26 Millionen CAD (19 Millionen USD) gesichert, um das Wachstum seiner Plattform voranzutreiben, die KI nutzt, um Benutzern bei der Erstellung von Videos aus einfachen Text- und Bildaufforderungen zu helfen.

Viggle brachte seine App im März dieses Jahres auf den Markt und die Fähigkeiten seiner Technologie gingen kurz darauf viral, als im Internet Videos kursierten, in denen Joaquin Phoenix‘ Joker-Persönlichkeit den Bühnenauftritt des Rappers Lil Yachty beim Summer Smash Festival 2021 ersetzte. Dies entwickelte sich im April dieses Jahres zu einem trendigen Meme-Format, als Social-Media-Nutzer begannen, Viggle zu verwenden, um andere Prominente und Charaktere in dasselbe Video einzufügen.

Eva Lau von TSFV bezeichnete das jüngste Wachstum von Viggle als „Schleudertrauma-auslösend“.

Dies verhalf dem KI-Startup in der Frühphase dazu, eine Community von mehr als 4,3 Millionen Mitgliedern auf der Messaging-Plattform Discord aufzubauen und sich neue Finanzierungen von Andreessen Horowitz (a16z) aus dem Silicon Valley und Two Small Fish Ventures (TSFV) aus Toronto zu sichern.

In einem Interview mit BetaKit sagte Hang Chu, Mitbegründer und CEO von Viggle, dass Viggle „wirklich, wirklich begeistert von dieser Viralität“ sei und merkte an, dass das Produktwachstum den Abschluss dieser Runde „ein wenig einfacher“ gemacht habe.

Viggles Serie-A-Finanzierungsrunde, die ausschließlich aus Eigenkapital und Primärkapital besteht, wurde Anfang des Monats abgeschlossen und von a16z mit Unterstützung des neuen Investors TSFV und anderer nicht genannter Geldgeber geleitet. Chu lehnte es ab, BetaKit die Bewertung des Startups oder Einzelheiten seiner früheren Finanzierungen mitzuteilen. Mit dieser Runde beträgt Viggles Gesamtfinanzierung mehr als 27 Millionen CAD (20 Millionen USD). Das Startup plant, sein neuestes Kapital in die Entwicklung eines stärkeren Modells, das Hinzufügen neuer Funktionen und die Verbesserung der Benutzerfreundlichkeit zu investieren.

„Es gibt viele Text-zu-Video-Generatoren, aber es handelt sich dabei hauptsächlich um pixelbasierte Modelle [that] sind schwer zu kontrollieren und es ist schwierig, das Geschehen im Video wirklich präzise zu bearbeiten“, sagte Chu. „Was wir anders machen, ist, dass wir den Aspekt der Kontrollierbarkeit betonen.“

Laut Chu ist eines der Dinge, die Viggle von anderen unterscheiden, die proprietäre JST-1-Technologie, ein Video-3D-Grundmodell, das physikalische Erkenntnisse einbezieht, um die Erstellung lebensechterer Charakterbewegungen und -ausdrücke zu unterstützen. Anhand von Text und vorhandenen Fotos oder Videos können Viggle-Benutzer einen Charakter und eine Art von Bewegung angeben, die dieser ausführen soll. Mithilfe von KI generiert Viggle dann basierend auf diesen Anforderungen ein animiertes Video.

Die bestehende Software von Viggle, die sowohl kostenlos als auch im Rahmen eines kostenpflichtigen Pro-Abonnements mit zusätzlichen Funktionen für 9,99 USD pro Monat erhältlich ist, richtet sich an eine Vielzahl von Benutzern. Sie hilft Inhaltserstellern und normalen Benutzern dabei, schnell animierte Charaktervideos aus Eingabeaufforderungen zu erstellen und vereinfacht den Ideenfindungs- und Vorproduktionsprozess für professionelle Animationsingenieure, Spieledesigner und Visual Effects-Künstler.

Laut Chu hat Viggle derzeit zwei Haupttypen von Nutzern: Leute, die es als neues Tool zum Erstellen von Memes verwenden, und Profis, von Kreativen bis hin zu Mitarbeitern von Film- und Spielestudios, die es als Tool zum Erstellen und Visualisieren von Inhalten nutzen. Um letztere Gruppe zu unterstützen, hat Viggle kürzlich ein Creator Program gestartet, eine kostenlose Initiative, die unter anderem ein Pro-Abonnement, zusätzliche 1.000 Credits – das entspricht 250 Minuten Video –, frühen Zugriff auf neue Funktionen und Möglichkeiten zum Austausch mit anderen Kreativen umfasst.

VERWANDT: Two Small Fish hält den endgültigen Abschluss von Fonds III in Höhe von 41 Millionen CAD

Chu räumte ein, dass der Markt für KI-Videogenerierung wettbewerbsintensiv geworden sei, behauptete jedoch, dass Viggles Leistung in Bezug auf die steuerbare Videogenerierung derzeit einzigartig sei. Während allgemeine Text-zu-Video-Modelle in der Ideenfindungsphase gut seien, argumentierte er, dass Viggles Modell heute „in der Nachbearbeitungsphase wirklich glänzt“.

Chu ist ein ehemaliger Doktorand der Universität Toronto, der Computervision und maschinelles Lernen bei Raquel Urtasun von Waabi und Sanja Fidler von Nvidia studierte. Zuvor arbeitete er auch als Forscher bei Autodesk, Facebook, Nvidia und Google.

TSFV-Mitbegründerin und Komplementärin Eva Lau beschrieb Chu gegenüber BetaKit als „außergewöhnlichen Gründer mit tiefgreifender technischer Expertise“ und fügte hinzu, dass die Technologie, die Viggles JST-1-Grundmodell zugrunde liegt, ebenfalls „extrem einzigartig und für andere sehr schwer zu replizieren“ sei.

„Wir bauen im Wesentlichen eine Grafik-Engine mit neuronalen Netzwerken“, sagte Chu. Während Viggle mit einem Charaktermodell begann, merkte er an, dass das Startup im Laufe der Zeit plant, weitere Funktionen hinzuzufügen, darunter die Möglichkeit, Objekte zu generieren, Charakter-Objekt-Interaktionen und schließlich ganze Szenen.

Chu verglich das bestehende Angebot des Startups mit einem Prototyp. „Dies ist ein Proof of Concept, dass es funktionieren kann“, sagte er und fügte hinzu, dass das Startup stärkere Modelle trainiere, um mit komplexeren Anfragen fertig zu werden und die Qualität der Videos zu verbessern, die es generieren kann. Diese ist im Moment aufgrund wackeliger Charakterbewegungen und unveränderlicher Gesichtsausdrücke begrenzt.

Auf die Frage, ob Viggles Technologie seiner Meinung nach menschliche Arbeit ersetzen oder unterstützen werde, antwortete Chu: „Wir versuchen, die Schöpfer zu stärken und zu unterstützen, statt ihre Kreativität zu ersetzen.“ Er betonte, dass der Fokus des Startups darauf liege, den Benutzern Tools bereitzustellen, mit denen sie den Prozess der Erstellung animierter Videos optimieren können – und nicht darauf, ihn vollständig zu automatisieren.

Doch die Technologie, die den KI-generierten Videos zugrunde liegt, auch Deepfakes genannt, kann auch gefährlich sein. Im schlimmsten Fall kann sie zur Erstellung von Fehlinformationen, nicht einvernehmlicher Pornografie und Machtbetrug verwendet werden. Auf die Frage, wie Viggle mit dem Potenzial umgeht, dass sein Produkt Urheberrechtsverletzungen und -missbrauch erleichtert, sagte Chu, das Startup habe „Community-Richtlinien, -Richtlinien und -Bedingungen, die Benutzer benötigen, um sicherzustellen, dass sie die Erlaubnis haben, das zu verwenden, was sie hochladen möchten.“

„Wir haben Moderationsmechanismen zum Schutz vor Missbrauch implementiert, wie zum Beispiel [not safe for work] Inhalte und politische Persönlichkeiten“, fügte Chu hinzu und merkte an, dass dies ein Schwerpunktbereich für Viggle sei. „Wir arbeiten aktiv daran, einschließlich eines Melde- und Entfernungsprozesses, um potenzielle Urheberrechtsverletzungen und -missbrauch zu bekämpfen.“

Auf die Frage, mit welchen Daten Viggles KI-Videomodelle trainiert werden, antwortete Chu BetaKit, dass das Startup öffentliche Quellen verwendet. „Viggle nutzt eine Vielzahl öffentlicher Quellen, um KI-Inhalte zu generieren“, sagte er. „Unsere Trainingsdaten wurden sorgfältig kuratiert und verfeinert, um während des gesamten Prozesses die Einhaltung aller Servicebedingungen sicherzustellen.“ Es ist unklar, was „öffentlich“ in diesem Zusammenhang bedeutet, aber angesichts der Art und Weise, wie andere Technologieunternehmen an das Training von KI-Systemen herangegangen sind, könnte es sich eher auf die Verfügbarkeit als auf die Rechte zur Verwendung der besagten Daten beziehen.

Chus Antwort hat gewisse Ähnlichkeiten mit dem, was OpenAI-CTO Mira Murati über die Trainingsdaten sagte, die für das Text-zu-Video-Modell Sora verwendet werden. Sie sagte dem Wall Street Journal, das Unternehmen verwende sowohl „öffentlich verfügbare Daten“ als auch lizenzierte Daten. Chu seinerseits sagte TechCrunch, dass Viggles Trainingsdatensatz YouTube-Videos enthielt, ein Eingeständnis, das ein Unternehmenssprecher zurückzunehmen versuchte, bevor er es TechCrunch gegenüber schließlich bestätigte.

Dies könnte zu Problemen für Viggle führen. Anfang des Jahres sagte YouTube-CEO Neal Mohan gegenüber Bloomberg, als er gefragt wurde, ob OpenAI möglicherweise YouTube verwenden würde, um Sora zu trainieren, dass die Verwendung von YouTube-Videos zum Trainieren eines KI-Text-zu-Video-Generators ein „klarer Verstoß“ gegen die Nutzungsbedingungen von YouTube wäre.

Gleichzeitig ist Viggle nicht allein. Laut Wired haben auch viele andere Entwickler von KI-Modellen, darunter Apple, Anthropic und Nvidia, YouTube-Videos als KI-Trainingsmaterial verwendet.

VERWANDT: Radical Ventures legt 800 Millionen US-Dollar schweren KI-Wachstumsfonds auf

Anfang des Monats wurde Nvidia mit einer Sammelklage von YouTube-Entwicklern konfrontiert, weil das Unternehmen seine Modelle anhand ihrer Inhalte trainiert hatte. Dies, nachdem eine Untersuchung von 404 Media ergeben hatte, dass Nvidia große Mengen an Videomaterial von der Plattform kopiert hatte. Zudem wurden interne Gespräche von Nvidia aufgedeckt, aus denen hervorging, dass den Mitarbeitern bekannt war, dass die Aktion möglicherweise nicht legal war.

Viggles schnelles Wachstum brachte auch seine eigenen Herausforderungen mit sich, von der Verwaltung des schnell wachsenden Discord bis hin zur hohen Nachfrage, die in einigen Fällen zu längeren Wartezeiten führte. Chu merkte an, dass das Startup daran arbeite, sicherzustellen, dass es über die nötige Kapazität verfügt, um die Bedürfnisse der Benutzer zu erfüllen, und dankte Discord und seinen Moderatoren für ihre Hilfe bei der Betreuung seiner großen Online-Community.

TSFV, das sich auf Deep-Tech-Startups im Frühstadium konzentriert, gab vor zwei Monaten den endgültigen Abschluss seines dritten, 41 Millionen CAD schweren Fonds bekannt. Viggle schließt sich einem TSFV-Portfolio an, zu dem auch das ebenfalls aus Toronto stammende KI-Startup Ideogram gehört, ein Midjourney-Konkurrent, der seine eigene Serie-A-Finanzierungsrunde über 80 Millionen USD abschloss und im Februar sein neuestes Text-to-Image-Modell auf den Markt brachte.

Das Risikokapitalunternehmen (VC) wurde vom Ehepaar Allen und Eva Lau gegründet, die früher bei Wattpad tätig waren, einer Social-Storytelling-Plattform mit Sitz in Toronto, die 2021 vom südkoreanischen Unternehmen Naver für mehr als 754 Millionen kanadische Dollar übernommen wurde. Allen Lau, Mitbegründer und ehemaliger CEO von Wattpad, ist jetzt geschäftsführender Gesellschafter von TSFV, während Eva Lau, zuvor Leiterin für Community und Inhalte bei Wattpad, derzeit TSFV leitet.

VERWANDT: Midjourney-Konkurrent Ideogram schließt 80-Millionen-Dollar-Serie A ab und bringt neuestes Text-zu-Bild-Modell auf den Markt

KI war in letzter Zeit auch ein Schwerpunkt für a16z. Im April schloss der plattformunabhängige VC-Riese 7,2 Milliarden USD für seinen neuesten Fonds ab, darunter einige große Investitionen in den Bereich KI, wobei 1,25 Milliarden USD für die KI-Infrastruktur und 1 Milliarde USD für KI-Apps vorgesehen waren. Berichten zufolge hat das Unternehmen auch einen Vorrat an begehrten KI-Chips angelegt, um in diesem Bereich Aufträge zu gewinnen.

Während der breitere Technologiemarkt im Zuge des gesamtwirtschaftlichen Abschwungs abkühlte und viele andere Startups und Fondsmanager Schwierigkeiten hatten, Kapital aufzutreiben, blieb KI weiterhin ein gefragter Trend. Von diesen Bedingungen profitierten kanadische Unternehmen wie Radical Ventures und Startups wie Viggle, Ideogram sowie der in Toronto ansässige Entwickler großsprachiger Modelle und OpenAI-Konkurrent Cohere.

Seit jedoch der KI-Finanzierungsrausch nach der Veröffentlichung von ChatGPT durch OpenAI Ende 2022 begann, sind einige Investoren gegenüber KI und den Ausgaben vieler Unternehmen vorsichtiger geworden, und das Wachstum von ChatGPT ist zum Stillstand gekommen. Im Juni sagte David Wong, Chief Product Officer von Thomson Reuters, gegenüber BetaKit: „Der Realitätscheck findet jetzt statt“, da Unternehmenskäufer anspruchsvoller geworden sind und begonnen haben, sich damit abzufinden, wo KI funktioniert und wo nicht.

Während sich der breitere Technologiemarkt abgekühlt hat, blieb die KI ein gefragtes Thema.

Doch Viggles Investoren sind angesichts seines Ansatzes und seiner bisherigen Fortschritte optimistisch hinsichtlich der Aussichten des Startups. In einer Erklärung stellte a16z-Partnerin Justine Moore fest, dass das Unternehmen von Viggles frühem Schwung und der Benutzerbasis, die es in wenigen Monaten aufgebaut hat, beeindruckt sei.

Eva Lau bezeichnete Viggles jüngstes Wachstum als „einen Schleudertrauma auslösend“. Sie behauptete, TSFV sei auf Viggle aufmerksam geworden und habe im März Gespräche mit dem Startup begonnen, als es bereits Tausende von Nutzern hatte.

Sie behauptete, dass die JST-1-Technologie von Viggle „das weltweit erste 3D-Video-Grundmodell mit echtem physikalischen Verständnis“ sei und argumentierte, dass sie „Viggle AI einen enormen Vorteil als Vorreiter verschafft“.

Allen Lau, der Viggle als Berater beigetreten ist, sagte gegenüber BetaKit, er sehe die Möglichkeit, dass Viggle mehr als nur ein einfacher Meme-Generator wird und „massive Umwälzungen im Bereich der Inhaltserstellung verursacht“. Der zum Investor gewordene Tech-Unternehmer plant, sich auf seine jahrzehntelange Erfahrung beim Aufbau und der Leitung von Wattpad und anderen Startups zu stützen, um Viggle zu unterstützen, das seiner Meinung nach „der nächste große kanadische KI-Superstar sein wird“.

UPDATE (26.08.24): Diese Story wurde aktualisiert und enthält nun weitere Antworten von Hang Chu, Mitbegründer und CEO von Viggle AI, sowie Informationen zu den mit Deepfakes verbundenen Risiken.

Titelbild mit freundlicher Genehmigung von Viggle AI.