Mange kokker og mye søl
Fusk og manipulering, utfordringer med stordata, og forfall i vitenskapene. Dette er ikke noe nytt. Allerede på 1830-tallet sto slike spørsmål på agendaen i Storbritannia.
Siden 1990-tallet har mye av debatten om forskningsetikk handlet om fusk og uredelighet, knyttet til forfalskning, fabrikkering og plagiat. I de siste årene har det også vært mye fokus på stordata, slik det fremgår av den nye rapporten om stordata i forskning fra De nasjonale forskningsetiske komiteene.
Fusk og manipulering av data har en lang forhistorie. Utfordringen på 1830-tallet var å forbedre kvaliteten på selve datainnsamlingen. Det var avgjørende for utviklingen av vitenskap som profesjon. Derfor var det viktig å skille en vitenskapelig tilnærming fra andre praksiser som forfalsking, støping, trimming og koking. Innsamlingen av data måtte bli disiplinert.
Dårlige data
Den vitenskapelige revolusjonen på 1600-tallet var nært knyttet til den eksperimentelle metoden, som blant annet ble formulert av Francis Bacon i verket Novum Organum fra 1620. Ved hjelp av nye instrumenter og vitenskapelig systematikk ble det mulig å frembringe nye fakta i laboratoriet, for eksempel om vakuum og trykk eller om lys og optikk.
Det var imidlertid ikke selvsagt at folk kunne stole på kunnskap om naturen som var konstruert ved hjelp av maskiner i et laboratorium. En annen viktig innovasjon var derfor at «fakta» ble etablert som en pålitelig kategori i løpet av 1600-tallet.
«Data», derimot, oppsto først på 1800-tallet. Her dreide det seg ikke om kontrollerte eksperimenter, men om tusenvis av målinger knyttet til kartlegging av naturfenomener som havstrømmer, jordmagnetisme og meteorologi.
Studieobjektet her var flyktig og foranderlig, som vær og vind. Mange av observatørene var ikke profesjonelle forskere, men snarere tilknyttet marinen, handelskompanier eller oppdagelsesreiser. De manglet også standardiserte instrumenter og måleteknikker. Deres data var derfor ikke pålitelige som kilder til kunnskap. Følgelig hadde disse fagområdene lav status innenfor de etablerte universitetene, hvor de eksakte vitenskapene dominerte.
Vitenskapenes forfall
Dårlig datakvalitet var noe av bakgrunnen for en viktig debatt om vitenskapenes forfall i Storbritannia i 1830-åra. Hovedpersonen var Charles Babbage, en Cambridge-utdannet matematiker som også var redaktør for den nautiske almanakken. For å kunne håndtere store mengder data begynte han å konstruere en mekanisk regnemaskin – en viktig forløper for den moderne datamaskinen.
Babbage slet imidlertid med å få økonomisk støtte til sin mekaniske regnemaskin. Praktisk arbeid sto lavt i kurs både ved universitetene og i Royal Society. I boka Reflections on the Decline of Science in England, and Some of its Causes fra 1830 kritiserte Babbage denne elitistiske holdningen.
Vitenskapsselskapet i London hadde forfalt, hevdet han, og de snobbete medlemmene var mer opptatt av selskapelighet enn av vitenskap. Mange var heller ikke forskere, men offiserer og lorder. De hadde sviktet arven fra Bacon og den vitenskapelige revolusjonen på 1600-tallet, ifølge Babbage.
I 1831 var derfor Babbage pådriver for etableringen av British Association for the Advancement of Science (BAAS). Foreningen ble raskt en arena for praktisk orienterte forskere og spilte en viktig rolle for profesjonaliseringen av vitenskap på de britiske øyene. Det var i forbindelse med etableringen av denne foreningen at Cambridge-kollegaen William Whewell oppfant begrepet «scientist», som ble brukt for første gang i 1834.
Det sentrale poenget til Babbage var at profesjonelle naturforskere også burde interessere seg for praktiske og samfunnsnyttige studier som meteorologi, elektrisitet og magnetisme. De måtte også ta ansvar for en mer disiplinert innsamling av data. Først på midten av 1800-tallet flyttet disse eksperimentelle naturvitenskapene inn på universitetene.
Skitt og kanel
Boka til Babbage handlet også om fusk i forskning. Det var umulig å utvikle vitenskapene når observasjonene var så middelmådige. Han kritiserte offiserer og polarhelter som samlet inn målinger fra fjerne strøk, og han viste hvordan de manipulerte data til å stemme med teoriene. For å beskrive dette formulerte han fire analogier til ulike former for fusk: forfalsking, støping, trimming og koking.
Det mest alvorlige, å forfalske selve studieobjektet (hoaxing), var heldigvis ikke så utbredt. Her viste Babbage til en ærverdig ridder fra Malta som i 1788 hevdet han hadde oppdaget en helt ny art på stranden i Sicilia. Men dyret var snarere sammensatt av ulike deler fra andre sjødyr og fantes faktisk ikke i virkeligheten. Følgelig ble alle data om dyret villedende.
Den andre formen for fusk var å støpe data (forging), altså å fabrikkere resultater som ikke var basert på direkte observasjon. Støping var en mer varig form for fusk, fordi slike data også kom inn i tabeller og vitenskapelige publikasjoner. Skaden var derfor større, og det tok lang tid å avsløre dem. Heller ikke støping var veldig utbredt, oppsummerte Babbage.
Det tredje formen var langt mer utbredt, nemlig å trimme data (trimming). Det dreide seg om å klippe bort biter her og der som ikke passer inn, som når du trimmer en busk eller klipper håret. Denne friseringen av data var tilsynelatende ikke så farlig, skriver Babbage, men det var likevel avgjørende for forskerens integritet og troverdighet. Presisjon var derfor avgjørende i både observasjon og analyse.
Det verste var likevel å koke data (cooking). Her handlet det ikke bare om at enkelte data ble utelatt. Her ble alle observasjoner kokt sammen i en suppe, slik at det var umulig å vite hva som var sant, og hva som bare var søl. Bare mengden data var stor nok, kunne kokken alltids finne resultater som passet smaken. Og dersom det ikke passet helt, var det bare å finne en annen oppskrift, slik at alle de utvalgte ingrediensene kom med. Forskerens oppgave var snarere å følge oppskriften og skjelne mellom skitt og kanel.
Avstand fra både lord og smed
På 1830-tallet måtte altså den nye rollen som profesjonell scientist skilles fra lordene og offiserene i vitenskapsselskapet. På den andre siden måtte de markere avstand til praktiske håndverksyrker som smeder, gartnere og kokker.
Data var ikke pålitelige i seg selv, men måtte kultiveres ved hjelp av vitenskapelige metoder, som også måtte ligge til grunn for innsamlingen av data. Vitenskapenes troverdighet forutsatte både individuell og institusjonell integritet. Og disse spørsmålene ble ikke borte, selv om de ble puttet inn i en datamaskin.
Les flere artikler om forskningsetisk historie:
Brukte dødsdømte i vaksineforsøk
Røykla fakta i 34 år
Referanser
Babbage, Charles (1830). Reflections on the Decline of Science in England, and Some of its Causes, London, s 174–183.
Higgitt, Rebekah (2012). «Fraud and the decline of science». The Guardian 13. september.
Hyman, Anthony (2002). «Charles Babbage: Science and reform», i Perter Harman og Simon Mitton (red.). Cambridge Scientific Minds, Cambridge University Press, s. 79–93.