Ett system som förstår video, ljud, bilder och text – byggt från grunden
Har nyligen startat eget bolag kring detta, så det känns extra spännande just nu. Hej! Kul att vara här 😊 Jag vill dela något jag har arbetat med under en längre tid. Det började som en idé, men har nu vuxit till en plattform som jag kallar VisionaryAI Suite, där fokus ligger på att analysera och strukturera ostrukturerad data video, bilder, ljud och även dokument. Jag har lagt mycket tid på att få flera AI-modeller att samverka i ett och samma system, där innehållet inte bara analyseras utan också blir sökbart och förståeligt i praktiken. Här är en kort demo av en funktion där systemet automatiskt kan översätta undertexter: https://youtu.be/gcbTWXkLEtI?feature=shared Det som har varit mest intressant i utvecklingen är hur man kan kombinera olika tekniker som objektigenkänning, transkribering, semantisk analys och LLM till ett sammanhängande flöde. Jag är väldigt nyfiken på vad ni här inne bygger själva och hur ni ser på framtiden kring lokala AI-lösningar vs molnbaserade. Ser fram emot att vara en del av communityn 🙏