Powered By Blogger

marți, 23 noiembrie 2010

Analiza si prelucrarea datelor

Analiza şi prelucrarea informaţiilor;
introducere în managementul cunoştinţelor

(Iniţiere în informatică şi Statistică ?)
Prin instruire şi experienţă, omul acumulează cunoştinţe şi deprinderi. In procesul de comunicare (inter-umană, publică, în scris, sau prin mediile de informare) se transmit informaţii (deduse – extrase din cunoştinţele emiţătorului). Receptorul, preluând informaţiile le interpretează (înţelegere, analiză, memorare, sau rejectare), transformându-le în cunoştinţe proprii. Evoluţia accelerată a societăţii în ultimele secole s-a datorat perfecţionării continue a mijloacelor de comunicare, implicit a metodelor educaţionale (de instruire) şi a căilor de stocare a cunoştinţelor accumulate.
Tiparul şi organizarea bibliotecilor şi a arhivelor moderne, cu cataloagele şi procedeele de indexare, căutare şi regăsire a informaţiilor, calculatorul electronic şi bazele de date (pe support magnetic), biblioteca electronică, şi, în fine "World Wide Web-ul", au condus la ceea ce astăzi numim Societate informaţională şi la viziunea către aşa-zisa Societate a cunoaşterii.
Accesul public la rezultatele cele mai recente, în toate domeniile cunoaşterii, simplificarea comunicării inter-umane (prin telefon, fax, e-mail), conduc la coagularea unor echipe de lucru (chiar comunităţi) fără restricţii teritoriale, la posibilităţi de cooperare greu de imaginat în trecut. Iar rezultatele se văd chiar în ritmul evoluţiei tehnico-ştiinţifice, în ritmul acumulării de noi cunoştinţe.

Informaţia

In dicţionarul Webster (Webster’s New Universal Unabridged Dictionary, 1996, Barnes and Noble Books), termenul information, în engleză (tradus uzual prin “informaţie”) se defineşte astfel:
  • Cunoştinţe communicate sau recepţionate, referitor la fapte sau circumstanţe particulare, ştiri (în româneşte: informaţii, dar substantivul englezesc este defectiv de plural),
  • Cunoştinţe obţinute prin studiu, comunicare, cercetare, instruire, etc., date concrete (în româneşte: informaţii),
  • Actul sau activitatea de informare (în româneşte: informare),
  • Birou sau oficiu – serviciu public de informare (în limba română folosit la plural, ca nume propriu ‘Informaţii’),
  • teoria informaţiilor este o funcţie, o mărime ataşată fiecărui mesaj, definită de Shannon cu logaritmul în baza 2,
  • In informatică, în sensul de date de intrare sau de ieşire (ale calculatorului), sau stadiul prelucrării (memorarea informaţiilor, transmisia informaţiilor, etc.),
  • Informaţiile şi cunoştinţele (precum şi acţiunile de informare şi cunoaştere) sunt termeni (relative echivalenţi – sinonimi, în anumite contexte şi cu termenii: date, fapte, sau indicaţii). Descriu achiziţia umană prin citit, studiu, experimente. Informaţia (informaţiile) privesc faptele spuse, citite, sau communicate, care pot fi ne-organizate şi chiar fără legătură între ele. In timp ce cunoştinţele constituie corpul organizat – corelat al informaţiilor, sau înţelegerea corespunzătoare “asimilării”.
  • Ca atribut, în expresii de forma: prelucrarea informaţiilor, regăsirea informaţiei, teoria sau chiar ştiinţa informaţiilor.

Dicţionarul enciclopedic al limbii române, referindu-se doar la cuvântul informaţie, aşa cum intervine în româneşte, este ceva mai concret:
  • Comunicare, ştire, veste; lămurire asupra unei persoane sau asupra unui lucru;indicaţie; totalitatea materialului de informare şi documentare ; izvor, sursă
  • Fiecare dintre elementele noi, în raport cu cunoştinţele prealabile, cuprinse în semnificaţia unui simbol sau a unui grup de simboluri (text scris, mesaj vorbit, grup de imagini, indicaţie a unui instrument, etc.).
  • Teoria informaţiei = teorie matematică a proprietăţilor generale ale surselor de informaţii, ale canalelor de transmisie şi ale instalaţiilor de păstrare şi de prelucrare a informaţiilor, considerată din punctul de vedere al proprietăţilor statistice ale acestora (are largi aplicaţii în telecomunicaţii, cibernetică, conducerea economiei, lingvistică, genetică, etc.).

(este vorba despre ediţia din 1978, Ed.St. şi Enciclopedică, Bucureşti).

Informatica se defineşte uzual ca studiul prelucrării informaţiilor, fiind acum un termen sinonim cu ştiinţa calculatoarelor. Cu toate acestea, pentru informatician calculatorul rămâne o unealtă, un instrument, nu este obiectul studiului. Chestiune subliniată remarcabil de unul din informaticienii de frunte, Djikstra, care spunea: Informatica are cam tot atâta de a face cu calculatorul, cât are astronomia cu telescopul.
Ca element particular al informaţiei se foloseşte termenul “dată”, care denumeşte şi factori individuali sau statistici, o informaţie concretă – particulară. Prelucrarea datelor este o expresie echivalentă cu prelucrarea informaţiilor. In schimb, vorbim despre structuri de date şi, mai ales, despre baze de date.
De la expeditor la destinatar, informaţiile circulă ambalate în forma unor mesaje. După modelul unei scrisori, în care antetul include adresele de expediţie şi de destinaţie, momentul emiterii, subiectul şi, eventual, urgenţa mesajului, modul de codificare, etc. In corpul mesajului informaţia care se transmite poate fi tradusă în alt limbaj, codificată sau criptată.

Puţin de tot despre statistică

Să vedem acum şi cum se defineşte “Statistica”. Potrivit dicţionarul enciclopedic al limbii române (1978), prin statistică înţelegem:
  • Date numerice referitoare la un fenomen de masă din natură ori din societate, culese, sistematizate şi centralizate (ex. Statistica populaţiei – demografie).
  • activitatea de culegere, prelucrare şi valorificare a datelor privind fenomenele de masă, organizată de către stat în mod centralizat (statistica oficială).
  • Disciplină ştiinţifică al cărei obiect este studierea fenomenelor de masă (colectivităţi sau populaţii), în care acţionează legi statistice, folosind metode proprii de descriere şi analiză.
  • Statistică matematică = ramură a matematicii care se ocupă cu elaborarea noţiunilor şi a metodelor specifice studiului statistic al colectivităţilor.
  • Teorie din fizică care descrie comportarea de ansamblu a unui sistem alcătuit din numeroase particule; a apărut din imposibilitatea descrierii individuale a fiecărei particule, iar rezultatele sale au caracter probabil, realizându-se experimental în limitele unor fluctuaţii inerente. Cazuri particulare: statistica clasică (Maxwell-Boltzmann (bazată pe interacţiunile din mecanica clasică), statistica cuantică (folosind interacţiunile din mecanica cuantică, cu particularizări Fermi-Dirac, Bose-Einstein).
  • In medicină, ca statistică vitală, epidemiologică, biostatistică...
In manualele de statistică definiţia acesteia sună ceva mai elegant:
“Arta de a face conjecturi numerice asupra unor chestiuni aparent imprevizibile”. Sau teoria care caută să răspundă întrebării:
“Dându-se un set particular de consecinţe, care stare a lumii ar putea să-i corespundă?”.
Statistica ne oferă mecanisme de analiză a volumelor mari de informaţii, a datelor privind populaţii numeroase, a situaţiilor în care interesează tendinţele sau comportarea ansamblului, nu a fiecărui individ în parte. Foarte des este vorba şi de cazuri în care determinările sunt incomplete, nu avem date de la fiecare individ, statistica oferind posibilitatea de compensa (suplini) aceste lipsuri. Aşa cum se întâmplă în cazul sondajelor de opinie, când chestionarele completate de un mic eşantion din populaţie, permit formularea unor concluzii privind întreaga populaţie.

Tipuri de informaţii

Să ne întoarcem însă la informaţii, şi să încercăm să clasificăm tipurile ce le întâlnim în jur, sau despre care auzim vorbindu-se. Putem încerca o clasificare după formă, conţinut (fond), sau după modul în care percepem – recepţionăm informaţia. Sau după tipul elementelor – simbolurilor ce o compun: in informatică vorbim despre modul de codificare al mesajului care transmite informaţia. (cifre – sistem de numeraţie, litere şi cuvinte – formule sau text scris, imagini - grimase, sunete muzicale, mirosuri – arome gustative, elemente tactile - ghionturi), … Putem analiza complexitatea informaţiei, clasificând-o după nivelul de elaborare – de complexitate (date primare, neprelucrate, analize şi rapoarte în care datele sunt prelucrate şi discutate, lucrări în care se elaborează teorii, previziuni, sau metode noi de lucru, dar şi opere sau interpretări artistice).
In fine, pentru informaţiile scrise, putem discuta despre suportul pe care sunt memorate – păstrate: notiţe – stenograme, manuscrise, documente tipărite (cărţi, articole în reviste, broşuri, pliante), documente electronice (pe benzi, casete video, dischete sau pe discuri compacte – CD-uri, documente Web - accesibile prin Internet). Si, mai ales la cele din urmă, intervine şi limbajul, elementele de tehnoredactare (forma de prezentare), nivelul de utilizare a elementelor grafice şi imagistice.
Persoana care recepţionează informaţia o poate înţelege sau nu. Asta depinde de nivelul cultural şi de cunoaşterea limbajului (codului) în care este transmisă informaţia. Dar şi de coerenţa informaţională.
  • Un mesaj formulat într-o limbă complet necunoscută va fi considerat neinteligibil şi rejectat (eventual păstrat pentru o traducere – decodificare ulterioară). Este echivalentul unui mesaj care nu poate fi decodificat. Situaţie care poate apare atunci când canalul de comunicaţie (linia telefonică, spre exemplu) are zgomote care depăşesc ca intensitate semnalul util.
  • Un mesaj cifrat are acelaşi efect asupra receptorului care nu posedă cifrul. Informaţia nu va putea fi preluată.
  • Pe de altă parte, un mesaj formulat în româneşte (sau în engleză) nu este neapărat inteligibil. Se poate referi la un domeniu complet străin destinatarului, sau poate fi stilistic incoerent, contradictoriu, sau pur şi simplu greşit din punct de vedere gramatical.
Primesc, spre exemplu, mesaje în chineză, sau în alte limbi orientale pe care nici măcar nu le pot identifica. Informaţia din acestea nu are cum să ajungă cu adevărat până la mine. Oricât de importantă şi coerentă ar fi. Percep doar o informaţie adiacentă, privind modul în care a început să se extindă Internetul şi acolo, sau modul cum a ajuns cunoscută adresa mea e-mail. Situaţii similare, din punctul meu de vedere, apar în cazul mesajelor transmise de viruşi, chiar dacă în acest caz se încearcă o spoială de coerenţă. La extrema cealaltă, un mesaj amplu, dar perfect coerent, poate fi rejectat de un destinatar care nu acceptă mesaje lungi (fie omul nu poate citi mai mult de trei fraze, fie utilitarul său de poştă electronică trunchiază sau chiar refuză mesajele ce depăşesc o anumită lungime).
In esenţă, coerenţa informaţiei recepţionate depinde de gradul de coerenţă a mesajului ce o poartă, de performanţele canalului de transmisie, precum şi de cunoştinţele şi deprinderile comunicaţionale ale destinatarului.
Revenind la clasificarea informaţiilor după conţinut, după nivelul de prelucrare şi după modul de percepere, deosebim:
  • Informaţii cantitative (numerice) din măsurători, costuri, evaluări = informaţii brute - date:
    1. numerice (contabile, financiare, experimentale),
    2. calendaristice,
    3. geodezice (geometrice, trigonometrice),
    4. astronomice,
    5. demografice,
    6. statistice.
  • Informaţii (interpretări) scrise = documente (texte)
    1. scrisori, communicate de presă, ştiri
    2. rapoarte (contabile, ştiinţifice, tehnice,...)
    3. publicaţii ştiinţifice (articole, cărţi)
    4. manuale şcolare, texte cu rol didactic,
    5. literare (romane, nuvele, eseuri, versuri)
    6. legislative
    7. istorice
  • audio-vizuale:
    1. comunicări verbale, conferinţe
    2. piese muzicale
    3. scheme, desene
    4. imagini, secvenţe animate, filme
  • extrasenzoriale:
    1. genetice
    2. subconştiente (vise, coşmaruri, mesaje telepatice)
Ca urmare a studiilor ce s-au făcut, în ultimul timp, reclamele comerciale, dar şi felurite mesaje cu tentă educaţională, formulează şi ambalează conţinutul informaţional în cât mai multe forme, însoţind textul scris cu sunete, cu imagini, scheme, şi animaţii. Se vorbeşte despre folosirea mijloacelor multi-media, pentru un impact cât mai puternic asupra grupului ţintă (destinatarii).

Coerenţă şi credibilitate

Corectitudinea şi coerenţa mesajului recepţionat, aşa cum am menţionat mai sus, nu sunt doar elemente formale ci depind şi de starea destinatarului (de priceperea şi cunoştinţele sale). De capacitatea sa de a decodifica, citi şi înţelege mesajul, de a extrage informaţia din el. Aceasta încă nu implică asimilarea informaţiei, adăugarea ei la setul de cunoştinţe pe care receptorul de posedă deja. Mesajul poate fi inteligibil chiar dacă informaţia ce o include este falsă sau contradictorie. Pentru a accepta şi a asimila informaţia, de cele mai multe ori este nevoie ca aceasta să ne convingă, să o credem, să o acceptăm ca adevărată. Discutăm deci despre credibilitatea informaţiei. Capacitatea de a pune la îndoială informaţia, de a analiza credibilitatea ei, depinde destul de mult de spiritul critic al receptorului. In lipsa spiritului critic toate informaţiile vor fi acceptate şi asimilate parţial. Ceea ce va conduce inevitabil la contradicţii şi confuzii. Organizarea eficientă şi utilizarea bagajului de cunoştinţe depinde mult de existenţa şi de profunzimea gândirii critice.
Cele mai multe din reclamele comerciale au aspectul unor informaţii credibile (şi se bazează pe această credibilitate, pentru a ne face să reţinem numele produsului şi să-l căutăm, sau cel puţin să-l cumpărăm atunci când îl vom vedea întâmplător). Doar spiritul critic şi experienţa în materie de reclame, ne pot ajuta să nu alergăm îndată să comandăm – cumpărăm produsul respectiv.
Dar ştirile, dar datele statistice, ce le recepţionăm pe diferite canale, sunt credibile ori ba? Un ilustru editor al unei publicaţii electronice europene, teoretiza că ştirile sunt ştiri, difuzate de agenţii specializate şi pe el, ca editor, nu-l interesează dacă sunt sau nu credibile!
Suntem într-o lume inundată de informaţii, asaltaţi de oferte şi reclame, pe toate canalele, la radio, TV, la telefonul mobil, la filme sau pe stradă, şi mai ales pe Internet. De unele ne ferim din instinct sau datorită spiritului critic, pe celelalte trebuie să le sistematizăm şi rezumăm cumva. Le încadrăm în tabele, facem diagrame, sau desenăm grafice. Sau pur şi simplu le “prelucrăm statistic”, ca să înţelegem mai bine, să urmărim evoluţia, în fond ca să facem faţă situaţiei.

Niciun comentariu:

Trimiteți un comentariu