Utopii ale cercetării științifice: I. evaluarea, intre antropologie, scientometrie și big data

In urmă cu mai mulți ani, pe când lucram la Los Alamos National Laboratory am avut parte de o intâlnire din genul celor care apar in legendele urbane sub titulatura “specialiștii americani au arătat că …” – cu alte cuvinte discuții despre care nu ai crede că au avut loc dacă nu le-ai fi trăit in mod direct.

Mary Meyer lucra in grupul de statistică la Los Alamos dar era de meserie … antropolog. La intrebarea mea uimită “ce caută un antropolog intr-un laborator federal ocupat indeobște cu “științele grele”, cu tehnologia nucleară intre altele” Mary mi-a dat exemplul producerii unui avion supersonic. Tehnologiile implicate in producerea avionului (avionică, știința materialelor, inginerie electrică, optică) erau atât de multe și implicau oameni de știință cu culturi atât de diferite incât comunicarea intre ei era dificilă, dacă nu imposibilă. Rolul antropologului era să medieze comunicarea dintre aceste subculturi. Nu știu dacă exemplul dat de interlocutoarea mea era unul real sau doar unul pedagogic, dar problema extragerii de informație de la experți este una serioasă din punct de vedere științific. Iar despre pierderea inter-generațională de cunoștințe in rândul atomiștilor de la Los Alamos s-au scris interesante teze de doctorat.

De intâlnirea cu antropoloaga americană mi-am amintit mai târziu, intr-un moment in care erau de actualitate discuțiile despre criteriile științifice care urmau să se aplice in România. Aceste discuții reuneau oameni venind din direcții științifice diverse, iar discuția pe această temă semănau teribil cu cele dintre specialiștii implicați in producerea avionului de la Los Alamos. Astfel chiar dacă discuția avea loc intre peers, oameni cu aproximativ aceeași pregătire științifică (suficient de inaltă) și care se reunoșteau mutual ca atare, invocarea cutumelor specifice ale fiecărei discipline părea să nu ducă nicăieri, fiecare fiind convins de “adevărul” paradigmei pe care o reprezenta și “neauzindu-l” pe celălalt.

*

Pentru a ilustra problema de mai sus permiteți-mi să va prezint câteva din normele sociale specifice informaticii.

Domeniu cu poziționare interesantă, știință și tehnologie in același timp, informatica poate fi descrisă cel mai bine drept o federație de subdomenii, unite vag doar prin “calculator” și afilierea instituțională comună a autorilor. Fiecare subdomeniu iși inventează conferințele sale preferate – informatica este lipsită de o publicație de vârf, cum sunt Nature sau Annals of Mathematics pentru alte discipline științifice, relevantă pentru intreg domeniul și care să reprezinte aspirația supremă in materie de publicare.

In al doilea rând: după cum am amintit deja, spre deosebire de fizică, chimie, etc in informatică modul preferat de a disemina informațiile e prin intermediul conferințelor – acestea având un rol și o dinamică diferită de cele din științele naturii: multe din conferințele din informatică sunt esențialmente “concursuri de lucrări”, cu cerințe stringente in privința conținutului, formatului (in general se prezintă contribuții in format “extended abstract” – 10-12 pagini, de obicei cu restricții draconice in materie de de paginare), datei de trimitere (se specifică, uneori la minut, data limită de trimitere – de obicei 11:59 PM – și fusul orar după care această oră este interpretată). Recenzarea este condusă de un comitet extins și este comparabilă cu cea de la o revistă, doar că mult mai rapidă. Spre deosebire de alte domenii posibilitățile autorului de a “răspunde” unei judecăți negative sunt limitate – decizia este in general finală. Volumul tipărit este de multe ori disponibil la momentul desfășurării conferinței.

Publicarea in reviste e, de multe ori, o alternativă mult mai lentă – nu e deloc neobișnuit să nu auzi nimic despre lucrarea pe care ai trimis-o timp de mai bine de un an – deși contribuții de calitate, dintre cele care erau mai greu de comprimat intr-o lucrare de conferință apar și in reviste. Revistele publică deseori numere speciale dedicate unei conferințe – insă uneori legătura cu conferința mamă e doar implicită, nu toate lucrarile publicate fiind dintre cele prezentare la conferință. In aceste cazuri există un call for papers public ulterior conferinței, pe tematici similare insă deschis tututor și cu un proces de recenzare obișnuit, grăbit doar de menționarea unor termene explicite pentru decizie/publicare.

In fine, dacă alte domenii au cutume bine definite privind ordinea autorilor (prim autor/autor corespondent in unele domenii, alfabetic in matematică) informatica nu respectă strict niciuna din acestea: in subdomenii precum informatica teoretică (inrudită cu matematica) se respectă ordinea alfabetică. In restul alte subdomenii deși parcă tot cutuma alfabetică e mai răspândită decât cealaltă, ea nu e universală.

*

Cititorul confruntat mai sus cu ciudățeniile unei paradigme de publicare destul de diferită (probabil) de cea proprie intuiește poate faptul că personal consider una din utopiile științei moderne căutarea unei formule matematice simple, transparente și universale, care să reușească să cuantifice “importanța” unei lucrări independent de domeniul căreia ii aparține și care să ne scutească de sarcina de a realiza judecăți de valoare.

Vreau să fiu bine ințeles: nu contest deloc posibilitatea realizării in viitor a unui program de calculator care, inglobând suficiente elemente specifice despre domeniile implicate, abilități de ințelegere automată a textelor și tehnici avansate de inteligență artificială să reușească să realizeze ce ne doream: o clasificare “corectă”. Numai că acea clasificare nu va fi, cred, una transparentă, pe baza unei formule matematice “obiective”.

Argumentul in sprijinul acestei ultimei afirmații este simplu: există probleme, multe dintre ele familiare oamenilor de știință, precum calcularea stării de energie minimă a modelului Ising in latici neplanare, in care complexitatea algoritmică intrinsecă a problemei calculării obiectului căutat elimină din start posibilitatea existenței unei metode matematice de calculare a “optimului” pentru problema respectivă. Aceasta nu inseamnă deloc că nu vom putea calcula in practică stările de energie minimă: va trebui insă să inlocuim “obiectivitatea” unei formule matematice intotdeauna valabilă cu subiectivitatea inerentă alegerii unei metode euristice intre multele disponibile. Alegerea unei astfel de euristici, chiar in cazul in care dă rezultate in practică, nu ne poate garanta in mod sistematic optimalitatea rezultatului. In cazul in care astfel de metode sunt utilizate pentru discriminarea intre mai mulți candidați, alegerea unei euristici sau a alteia i-ar putea avantaja pe unii dintre competitorii evaluați și dezavantaja pe alții, adică exact situația pe care utilizarea de mijloace “obiective”, preferabile judecăților de valoare, ar fi trebuit să o elimine. Fără a avea dovezi științifice in acest sens, cred că situația e conformă cu descrierea de mai sus in cadrul măsurării impactului științific individual. Nu in ultimul rând problema măsurării impactului științific individual mai ridică o chestiune de principiu: de cele mai multe ori metodele cele mai performante nu sunt strict matematice ci mai curând algoritmice. Trebuie să ne intrebăm dacă chiar suntem pregătiți, in numele utilizării unor metodei obiective cât mai “performante” să inlocuim judecățile de valoare printr-o ierarhizare a oamenilor realizată de un program de calculator.

*

Dacă sunt sceptic privind evaluarea individuală a cercetătorilor pe baze analitice, sunt in schimb un partizan inflăcărat al ințelegerii societății umane, a comunităților științifice, pe astfel de baze. Orice discuție serioasă despre “formele ideale și normative de colaborare” nu poate face abstracție de faptul că, impulsionată de datele tot mai ușor accesibile, analiza rețelelor sociale cu metode algoritmice a progresat dramatic in ultimii zece ani. Știm tot mai bine cum să măsurăm “centralitatea” nodurilor intr-o rețea socială. Cunoaștem tot mai multe lucruri depre structura acestor rețele și felul in care această structură influențează procese precum transmiterea informației sau dezvoltarea ei ulterioară. Dispunem de modele strategice pentru formarea acestor rețele bazate pe teoria jocurilor.

Cum articolul de față nu este locul potrivit pentru a recenza imensa literatură in domeniu mă voi mărgini să recomand un articol mai vechi (dar popular) in domeniu și două manuale care tratează acest domeniu din perspective ușor diferite (fizica sistemelor complexe, respectiv economie).

E posibil ca astfel de studii să ducă intr-un viitor ceva mai indepărtat, pe când calculatoarele vor fi mult mai inteligente decât sunt in momentul de față, la metode “obiective” de evaluare a impactului științific individual. Nu suntem incă acolo. Până atunci, o atitudine sănătoasă, consistentă cu statutul nostru de slujitori ai adevărului și rațiunii, este prudența evaluativă și primatul pe care il au modelarea și ințelegerea complexității unei probleme in fața sprijinului militant pentru o soluție particulară sau alta.

Imi dau seama că această reținere poate părea desuetă intr-o epocă in care părem din ce in ce mai obsedați de “impact”, de publicarea in revistele din vârful ierarhiei, de intre cercetători pentru alocarea resurselor. Sunt convins insă că pe termen lung o astfel de atitudine oferă o ințelegere mai adecvată a unui domeniu, cel al cunoașterii, din ce in ce mai afectat de o paradigmă care (in opinia mea) nu ii e proprie: cea a competiției, a “pieței”. Despre această tendință insă, o altă, pentru mine, “utopie” a științei contemporane, voi vorbi poate intr-un eseu viitor.

GIGabriel Istrate (B. Sc. University of Bucharest, Ph. D. University of Rochester) is a theoretical computer scientist affiliated with the West University of Timisoara and the e-Austria Research Institute. His research interests span theoretical computer science, theoretical foundations of complex systems, game theory, combinatorial and algorithmic models in economics and networks

Leave a Reply

Your email address will not be published. Required fields are marked *