Gå til hovedinnhold

Betydningen av avstand i maskinlæring


AI, KI, illustrasjonsbilde på kunstig intelligens

Hyeongji Kim disputerer for ph.d.-graden ved Universitetet i Bergen den 23. oktober 2023 med avhandlingen "On the Significance of Distance in Machine Learning".

Hva er avstand? Vanligvis tenker vi på avstand som lengden på en rett linje som forbinder to forskjellige steder. Ideen om avstand kan imidlertid brukes på mer enn bare fysiske posisjoner. I maskinlæring representerer vi ofte informasjon, som for eksempel et bilde eller en tekst, som et punkt i et abstrakt rom. Bruken av disse punktene, kjent som innbygginger, lar oss beregne avstanden mellom dem. I oppgaven sin utforsker Hyeongji ulike aspekter ved avstand i maskinlæring, og utvikler flere nye metoder.

dyp metrisk læring bruker vi et dypt nevralt nettverk for å beregne innbygginger slik at avstandene gir mening. For eksempel kan semantisk like data plasseres tett sammen, mens semantisk ulike data plasseres lenger fra hverandre. Dette gjør dem svært nyttige for å søke etter lignende bilder i en database. Hyeongji introduserer en ny måte å trene metriske læringsmodeller på, kalt «avstandsforholdsbasert formulering». Dette muliggjør raskere og mer stabil trening enn standardformuleringen.

Noen ganger eksisterer hierarkiske relasjoner mellom klasser. Å inkludere disse hierarkiene i klassifiseringsmodeller er ofte ønskelig, men eksplisitt informasjon om klassehierarki er ikke alltid tilgjengelig for alle datasett. Hyeongji undersøker om klassehierarkier kan utledes fra metriske læringsmodeller ved å undersøke avstandene mellom innbygginger.

Vanlige maskinlæringsklassifiserere er mottakelige for umerkelige, ondsinnede endringer av inndata. For utbredt bruk av maskinlæringsmodeller er det avgjørende å utforme modeller som er robuste mot slike ondsinnede endringer. Selv om robuste modeller er utviklet, eksisterer det en avveining mellom klassifiseringsnøyaktighet og robusthet. For å møte denne avveiningen, har Hyeongji utviklet et nytt robusthetsmål kalt «Voronoi-epsilon motstridende nøyaktighet».

Portrettbilde av H. KimPersonalia

Hyeongji Kim fullførte en mastergrad i bioinformatikk ved Københavns Universitet (Danmark). Under doktorgradsstudiet var hun ansatt ved Havforskningsinstituttet. Hun ble veiledet av førsteamanuensis Ketil Malde (HI) og førsteamanuensis Pekka Parviainen.

Tid og sted for disputasen

Tid: Mandag 23. oktober 2023 klokken 09.00–11.00

Sted: VilVite (Auditorium), Thormøhlens gate 51, Bergen