Lego, Machine Learning og bildegjenkjenning
Med Star Wars-lego viser Akos Buzinkay, dataingeniør i Basefarm, hvordan maskinlæring kan brukes til å gjenkjenne lego-figurer.
Maskinlæring, Machine Learning på engelsk, er et komplekst område, og det kan være vanskelig å forstå hva teknologien kan brukes til.
I motsatt ende finner vi lego, som er velkjent og er kjært i manges hjerter og barndomsminner. Time etter time har blitt brukt på å lage kreasjoner med de fargerike klossene. Noen bygde hus, byer, kjøretøy eller forhåndsbestemte modeller.
Akos Buzinkay derimot – fikk en ide om å bruke klossene til å demonstrere potensialet i datadrevne løsninger, i dette tilfellet maskinlæring. Akos er Senior Dataingeniør ved den nyetablerte Data Driven Solutions-avdelingen her i Basefarm. Han er ansvarlig for å komme med innovative og unike løsninger til kundenes behov ved hjelp av konkrete data og kreativ innovasjon.
“Jeg ville vise konferansedeltakerne noe som fanget oppmerksomheten og samtidig øke deres forståelse for hva maskinlæring kan gjøre. I tillegg ønsker jeg å briefe litt med kunnskapen vi i Basefarm sitter på. Mange på konferansen kjenner kanskje ikke til maskinlæring, så dette er en morsom måte å gi bedre forståelse!”
Det er en klar lidenskap i måten Akos driver med problemløsning på. Han strever etter å kombinere kreativitet og teknologi. Inspirert av den ikoniske Star Wars-sagaen, kom ideen om å bruke Star Wars-lego han hadde hjemme for å demonstrere kraften i teknologi for bildegjenkjenning.
Målet: Maskinen skal gjenkjenne og “fange” en forkledd Luke Skywalker og hans sidekick, R2D2, når de prøver å få tilgang til Death Star. Prosessen startet med å knipse over 800 bilder av Lego-figurene der 200 av bildene ble merket og flagget som riktige. Bildene trener opp maskinen til å lære å gjenkjenne Luke Skywalker og R2D2 for å kunne klare å “fange” dem.
Med bruk av Tensor Flow (et open source maskinlæring bibliotek), Googles TPU-brikke og et høyteknisk webkamera, er maskinen i stand til å fange Luke Skywalkers med en hastighet på 140 fps og dermed forhindre han fra å eksekvere på onde planer.
Betydningen av denne type teknologi kan være stor for det moderne samfunnet. I følge Googles AI-blogg kan teknologien oversette tegnspråk og forbedre hverdagen til hørselshemmede.
Datadrevne løsninger er mye mer enn maskinlæring med kunstig intelligens og bildegjenkjenning. De fleste bedrifter har utfordringer og problemer som kan løses med teknologien, men det krever en unik tilnærming og har sjeldent en generisk løsning.
Gjennom bruk av datavitenskap og fokus på spesifikke problemer, er Akos i stand til å utforske uante muligheter for Basefarms kunder. Et eksempel på dette er en demo som ble presentert for en kunde. Etter en inngående samtale med bedriften, utviklet Akos et konsept som bidro til å ytterligere sikre omkretsen rundt et inngjerdet industriområde.
Demonstrasjonen viste mulighetene for å holde gjerdet så sikkert som mulig ved å bruke droner, lasere og bildegjenkjenningsteknologi. Bevæpnet med denne teknologien kan bedriften identifisere sikkerhetshull og dermed spare ressurser på manuell inspeksjon.
“Det er umulig for meg å si hvordan jeg skal gjennomføre mitt neste prosjekt. Hver case er unik. Det er viktig å fortelle kundene at vi ikke er her for å selge lisenser og produkter, men en mulighet for et samarbeid hvor problemer løses ved bruk av skreddersydd teknologi. Vi fordyper oss i problemet, idèmyldrer løsninger og presenterer det for kunden. Dette er hvordan vi kan løse problemet ditt gjennom teknologi, er du interessert i det kjære kunde?”