Publisert: 04.01.2021
I 2005 hadde Havforskningsinstituttet samlet inn omtrent 25 terrabyte med digitale data. I dag har instituttet til sammen 2500 terrabyte med data. Altså en hundredobling eller en økning på 9900 prosent.
– Vi har opplevd en eksponentiell vekst de siste årene som vi forventer vil fortsette. Økningen kommer som en følge av ny teknologi som gir nye muligheter for mer detaljert datafangst, slik vi har fått på våre nye og moderne fartøyer de siste årene, sier Bjørn Arvid Sætren, digital direktør ved HI.
I 2018 samlet instituttet inn seks megabyte i sekundet, og veksten vil bare øke fremover.
– Vi har fantastiske muligheter til å finne skatter i disse dataene ved å kombinere vår kunnskap om havet med ny teknologi innenfor maskinlæring, dataanalyse og datavisualisering, sier digitaldirektøren.
Forskningsfartøyene bidrar med desidert mest data, men digitaldirektøren forventer en stor vekst i datainnsamling fra andre datakilder som har kommet til de siste årene. Det er bøyer som flyter med havstrømmene, undervannsfarkoster, radar og det nyåpnede LoVe havobservatoriet.
– Våre data spenner seg fra undervannsvideo og sonar til temperatur, havstrømmer og bølgemålinger. Nye data kommer til i takt med utviklingen av sensorteknologi. Dette er big data i praksis, sier Sætren.
En del av disse dataene brukes ikke av forskerne i dag, men de har likevel stor verdi. De kan nemlig ha mye å si for havforskning i fremtiden.
– Tidsserier er viktige for å bygge kunnskap over tid. Og vi har samlet mye data i lange tidsserier som vi kanskje ikke ser potensialet av i dag. Disse dataene kan likevel bety mye for fremtidig havforskning og bidra til en bærekraftig utvikling i havet, sier Sætren.
Den største jobben for den nye avdelingen HI Digital er å etablere gode prosesser som sørger for å strukturere, kvalitetssikre og lagre data på en sikker og fremtidsrettet måte.
– Informasjonssikkerhet er helt avgjørende med tanke på datakvalitet, som er avgjørende for at forskerne kan anvende dataene. Det er som et isfjell: Det som er over vannet er dataene som er synlige og tilgjengelige, mens det ligger en enorm jobb under overflaten. Der sikrer HI Digital en god prosess fra dataene blir fanget på sensor til dataene blir tilgjengelig for samfunnet, sier Sætren.
Å lagre 2500 terrabyte, eller 2,5 petabyte, med forskningsdata, som bare vil bli større i fremtiden, krever en helt spesiell teknologi som er laget for å ha styring på skalerbarhet og pris.
– Vi har investert mye de siste årene for å øke tilgjengeligheten av våre data. De siste årene har vi flyttet 180 millioner filer med forskningsdata som nå klargjøres for mer effektiv bruk i nye løsninger. Og vi skal ta ytterligere steg i 2021, sier digitaldirektøren.
Big data, eller «et hav av data», er en viktig del av havforskningstiåret som begynner nå i 2021. Innsamling, tolkning og deling av data er en viktig støtte for en helhetlig og kunnskapsbasert forvaltning av havet, som er et hovedmål med tiåret.
– Det som blir viktig for oss fremover er å fortelle om våre gode data til et enda bredere publikum enn vi gjør i dag. Vi kan forklare, fortelle og formidle enda mer, slik at fakta når frem til alle deler av samfunnet og skaper felles oppfatninger av situasjonen i havet. Sånn som værmeldingstjenesten yr.no gjør i luften, sier Sætren.
Digitaldirektøren peker også på viktigheten av å sørge for at dataene brukes riktig.
– I dag er alle sin egen redaktør på sosiale medier. Det er lett for individer og organisasjoner å bruke våre data i egne analyser med en egen forenklet tolkning. Problemet er at kunnskapen om våre data ikke alltid oppfattes eller følger med når dataene formidles. Dette kan vi gjøre noe med i havtiåret, sier digitaldirektøren.