Hur fungerar AI / computer vision (förklaring för 5 Äring)
LĂ„t mig bryta ned det. 1. Datorn fĂ„r en bild skickad till sig. 2. Datorn anvĂ€nder en process som heter convolution: Vi kan se det som att vi "anstĂ€ller" en liten gubbe med ett förstoringsglas som analyserar varje pixel av bilden, dĂ€r gubben letar efter mönster och detaljer. Oftast sĂ„ anstĂ€ller man 16, 32 eller 64 smĂ„ gubbar samtidigt. NĂ€r dessa smĂ„ gubbar gjort klart sin analys ger de oss en tabell med numeriska vĂ€rden dĂ€r de högsta vĂ€rdena pĂ„ den tabellen reflekterar de delar av bilden dĂ€r de hittat mönster och detaljer. 3. Förenkla gubbarnas resultat: VĂ„ra smĂ„ gubbar med förstoringsglas har nu försett oss med 16, 32 eller 64 olika individuella tabeller med data. Dessa tabeller har VĂLDIGT mycket data och Ă€r tredimensionella. DĂ€rför sĂ„ applicerar vi en funktion som heter pooling, dĂ€r vi extraherar endast de högsta numeriska vĂ€rdena, eftersom det Ă€r de högsta vĂ€rdena som betyder att vĂ„ra gubbar hittat ett mönster i bilden. Detta minskar Ă€ven storleken pĂ„ dessa tabeller och gör att vĂ„ra datorer kan enklare "computa" dessa tabeller. 4. Vi repeterar steg 2 och 3: Vi anstĂ€ller 16, 32 eller 64 smĂ„ gubbar med förstoringsglass som ska convolva bilderna IGEN och leta efter FLER komplexa mönster. Dessa gubbar fortsĂ€tter arbetet frĂ„n de tidigare gubbarna - alltsĂ„ sĂ„ analyserar de vad de andra redan tidigare har analyserat. Vi applicerar pooling igen, för att endast fĂ„ med oss den datan som Ă€r relevant (dĂ€r vĂ„ra arbetare funnit mönster). Man kan repetera detta steg med att fortsĂ€tta anstĂ€lla smĂ„ gubbar och poola deras resultat mĂ„nga gĂ„nger. Desto fler gĂ„nger man gör det, desto mer detaljer av bilden man fĂ„ngar, men det kan medföra problematik i form av att modellen blir för smart för sitt egna bĂ€sta och börjar lĂ€ra sig fel saker (overfitting/high variance). Om du kollar pĂ„ den bifogade bilden sĂ„ ser du att varje bild har en gul ruta pĂ„ sig och att den blir mindre och mindre â den gula rutan representerar gubben med förstoringsglas som analyserar, och att bilden blir mindre Ă€r för att vi applicerar pooling för att fĂ„ bort all irrelevanta delar av bilden vi lĂ€ngre inte vill ha