<iframe width="830" height="375" src="https://www.youtube.com/embed/IJJgcZ2DEs0" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>

 

Les points-clés

  • L'information humaine est transcrite sous forme de données pour être manipulée numériquement.
  • On distingue les données qui doivent être entrées dans la machine, des résultats de calculs, ou sortie des algorithmes. 
  • Les données en tant qu'objets numériques forment un bien non rival*  dont la copie ne coûte quasiment rien, et que l'on peut dupliquer sans le consommer.
  •  La production gigantesque de données pose des problèmes planétaires en matière d'environnement (consommation énergétique, utilisation de ressources naturelles rares).
  •   La prolifération de données  pose aussi un problème de pérennité à long terme (plusieurs dizaines d'années) qui n'est pas résolu actuellement.

(*) bien non rival : la plupart des objets matériels sont des biens rivaux c'est-à-dire que si on les consomme ils n'existent plus,  ce n'est pas le cas des objets informationnels comme par exemple une bonne histoire : si je la partage, elle reste intacte, voire elle s'enrichit.

Les mots-clés

  • Mégadonnées : (bigdata) on parle de mégadonnée quand le volume de données est tel qu'on peut faire des analyses statistiques qui permettent de prédire des informations, même si les données sont très diverses, sans information structurée, et approximatives.
  • Données ouvertes : (opendata)  données numériques, d'origine publique ou privée, diffusées de manière structurée selon une méthode et une licence libre, garantissant leur libre accès et leur réutilisation par toutes et tous, sans restriction technique, juridique ou financière.
  • Licence libre : licence s'appliquant à une œuvre de l'esprit (document, logiciel, …) par laquelle l'autrice ou l'auteur concède les droits que lui confère le droit d'auteur  : usage de l'œuvre, étude de l'œuvre pour en comprendre le fonctionnement ou l'adapter à ses besoins, modification (amélioration, extension et transformation) ou incorporation de l'œuvre en une œuvre dérivée, redistribution de l'œuvre, c'est-à-dire sa diffusion à d'autres usagers, y compris commercialement.
  • Informatique durable : (green IT) vise à réduire l'empreinte écologique, économique et sociale des technologies de l'information et de la communication.
  • Règlement général sur la protection des données (RGPD) :  renforce et unifie la protection des données pour les personnes au sein de l'Union Européenne.

VOLET HISTORIQUE

L'idée de pouvoir traiter mécaniquement de l'information est ancienne, dès le XVIIème siècle, par exemple, Gottfried Wilhelm Leibniz va chercher à établir une langue dite caractéristique universelle, qui permettrait d'exprimer la totalité des pensées humaines et pourrait résoudre des problèmes par un calculateur (calculus ratiocinator), anticipant l'informatique de plus de trois siècles. Il faudra attendre le XXème siècle pour comprendre qu'une telle machine est un objet impossible ne serait-ce qu'en mathématiques, d'après les théorèmes d'Alonzo Church et Alan Turing : très simplement, certains calculs (par exemple savoir si un programme va boucler à l'infini, le problème de l'arrêt) nécessitent des temps … infinis. On commençait à comprendre les limites de l'intelligence mécanique avant même de l'avoir fabriquée.

Ces mêmes personnes ont pourtant fondé, dans les années 1930, l'informatique, un domaine d'activité scientifiquetechnique et industriel concernant le traitement automatique de l'information par l'exécution de programmes informatiques par des machines. On peut attribuer à Ada Lovelace, un siècle avant, d'avoir compris que l'on peut «  calculer sur des nombres mais aussi sur des symboles », on parlerait de données numériques et symboliques aujourd'hui.  Il est intéressant de noter que ces idées sont nées avant la technologie permettant de les mettre en œuvre.

Parrallèlement, dans les années 1880, Herman Hollerith, futur fondateur d'IBM, fonde la mécanographie en inventant une machine électromécanique destinée à faciliter le recensement en stockant les informations sur une carte perforée. Ces premières cartes perforées ont fait leur apparition au XVIIIe siècle dans divers automates et en particulier les métiers à tisser, les orgues de Barbarie et les pianos mécaniques.

L'histoire de l'informatique va véritablement commencer au milieu du XXème siècle avec l'architecture de von Neumann, mise en application de la machine universelle de Turing : les ordinateurs dépassent la simple faculté de calculer et peuvent commencer à traiter des données …

 

Ce que dit le programme

Repères historiques

  • 1930 : utilisation des cartes perforées, premier support de stockage de données.
  • 1956 : invention du disque dur permettant de stocker de plus grandes quantités de données, avec un accès de plus en plus rapide.
  • 1970 : invention du modèle relationnel (E. L. Codd) pour la structuration et l’indexation des bases de données.
  • 1979 : création du premier tableur, VisiCalc.
  • 2009 : Open Government Initiative du président Obama.
  • 2013 : charte du G8 pour l’ouverture des données publiques.

EXPLICATION DES NOTIONS

Les idées-clés

  • Toutes les informations humaines se codent en binaire ; bien entendu ce n'est pas l'objet réel, ce n'est que son reflet numérique.
  • Une donnée est spécifiée par des valeurs et chaque valeur a un type (par exemple : vrai ou faux, on dit booléen ; ou bien numérique ou textuel ; ou encore un type spécifique, comme une date) ; selon le type de la donnée on ne fait pas les mêmes opérations.
  • Une donnée se décompose de manière atomique en données élémentaires, par exemple le nom d'une personne en prénom et patronyme. Bien structurer les données facilite leur traitement par des algorithmes.
  • Une collection de données peut être ordonnée sous forme de liste, ou bien sans ordre sous forme d'un ensemble.
  • La façon de structurer les données influe fortement sur les opérations de traitement : il est par exemple bien plus efficace de rechercher une donnée dans une collection toujours ordonnée, mais y insérer une information est plus coûteux.

Les mots-clés

  • Donnée : représentation d'une information au sein d'un système informatique.
  • Métadonnée : donnée servant à définir ou décrire une autre donnée, pour permettre sa manipulation.
  • Une base de données regroupe plusieurs collections de données reliées entre elles.
  • Descripteur : mot ou un groupe de mots choisi pour caractériser les informations contenues dans un document et pour faciliter les recherches.

Les données et l’information

Une donnée est une valeur décrivant un objet, une personne, un événement digne d’intérêt pour celui qui choisit de la conserver. Par exemple, le numéro de téléphone d’un contact est une donnée. Plusieurs descripteurs peuvent être utiles pour décrire un même objet (par exemple des descripteurs permettant de caractériser un contact : nom, prénom, adresse et numéro de téléphone).

Une collection regroupe des objets partageant les mêmes descripteurs (par exemple, la collection des contacts d’un carnet d’adresses). La structure de table permet de présenter une collection : les objets en ligne, les descripteurs en colonne et les données à l’intersection. Les données sont alors dites structurées.

Pour assurer la persistance des données, ces dernières sont stockées dans des fichiers. Le format CSV (Comma Separated Values, les données avec des séparateurs) est un format de fichier simple permettant d’enregistrer une table. À tout fichier sont associées des métadonnées qui permettent d’en décrire le contenu. Ces métadonnées varient selon le type de fichier (date et coordonnées de géolocalisation d’une photographie, auteur et titre d’un fichier texte, etc.).

Les données comme les métadonnées peuvent être capturées et enregistrées par un dispositif matériel ou bien renseignées par un humain. Elles sont de différents types (numériques, textes, dates) et peuvent être traitées différemment (calcul, tri, affichage, etc.).

Certaines collections typiques sont utilisées dans des applications et des formats standardisés leur sont associés : par exemple le format ouvert vCard (extension .vfc) pour une collection de contacts.

Une base de données regroupe plusieurs collections de données reliées entre elles. Par exemple, la base de données d’une bibliothèque conserve les données sur les livres, les abonnés et les emprunts effectués.

 

Les algorithmes et les programmes

La recherche dans des données structurées a d’abord été effectuée selon une indexation préalable faite par l’homme. Des algorithmes ont ensuite permis d’automatiser l’indexation à partir de textes, d’images ou de sons.

Une table de données peut faire l’objet de différentes opérations : rechercher une information précise dans la collection, trier la collection sur une ou plusieurs propriétés, filtrer la collection selon un ou plusieurs tests sur les valeurs des descripteurs, effectuer des calculs, mettre en forme les informations produites pour une visualisation par les utilisateurs.

La recherche dans une base comportant plusieurs collections peut aussi croiser des collections différentes sur un descripteur commun ou comparable.

 

 

 

Les machines

Les fichiers de données sont stockés sur des supports de stockage : internes (disque dur ou SSD) ou externes (disque, clé USB), locaux ou distants (cloud). Ces supports pouvant subir des dommages entraînant des altérations ou des destructions des données, il est nécessaire de réaliser des sauvegardes.

Des recherches dans les fichiers se font à l’intérieur même des ordinateurs, soit sur la base de leurs métadonnées, soit sur la base d’une indexation (à la manière des moteurs de recherche sur le Web).

Les grandes bases de données sont souvent implémentées sur des serveurs dédiés (machines puissantes avec une importante capacité de stockage sur disques). Ces centres de données doivent être alimentés en électricité et maintenus à des températures suffisamment basses pour fonctionner correctement.

 

N1 - Les données et leurs traitements > Découvrir la thématique

LIENS ET RESSOURCES COMPLÉMENTAIRES

Ressources complémentaires pour se former

Ressources pour créer son cours

N1 - Les données et leurs traitements > Découvrir la thématique

QUIZ N N°1

QUESTION 1

 
(1/1 point)

Parmi ces exemples, le/lesquels est/sont des biens rivaux ?

Une ou plusieurs réponses possibles.
Un des disques vinyles (produit à plus d’un million d’exemplaires) de la chanson “Que je t’aime” de Johnny Halliday., - correct
   
Vous avez utilisé 1 essais sur 3

QUESTION 2

 
(1/1 point)

Qu’est-ce qui peut être codé en binaire sur un ordinateur ?

Attention, plusieurs réponses sont possibles :
un nombre, une mesure physique, un texte avec des caractères, une image ou une vidéo, un son de musique, - correct
   
Vous avez utilisé 1 essais sur 3

QUESTION 3

 
(1/1 point)

Qui a inventé le stockage de données sur des cartes perforées ?

On fera une recherche wikipédia pour trouver la réponse à cette question :
 
   
Vous avez utilisé 2 essais sur 3

QUESTION 4

 
(1 point possible)

Une VCard est un format standard ouvert d'échange de données personnelles. Ci-dessous un exemple :

 

BEGIN:VCARD
VERSION:2.1
FN: Jean Dupont
N:Dupont;Jean
ADR;WORK;PREF;QUOTED-PRINTABLE:;Bruxelles 1200=Belgique;6A Rue Th. Decuyper
TEL;CELL:+1234 56789
EMAIL;INTERNET:Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
END:VCARD

 

Parmi ces affirmations lesquelles sont exactes ?

Plusieurs réponses possibles :
Ce format de données permet à la fois de transmettre ses coordonnées entre agendas et est aussi utilisé par des logiciels de messagerie., Dans ce format la ponctuation et les mots (ici en majuscule comme par exemple TEL;CELL:) sont les éléments-clés du langage, les autres mots correspondent aux données., - incorrect
 
Vous avez utilisé 3 essais sur 3

QUESTION 5

 
(1/1 point)

Pourquoi l’ordinateur a-t-il besoin de connaître le type des variables que l’on crée ?

 
   
Vous avez utilisé 1 essais sur 3

 

 

 

 

En poursuivant votre navigation sur mon site, vous acceptez l’utilisation des Cookies et autres traceurs  pour réaliser des statistiques de visites et enregistrer sur votre machine vos activités pédagogiques. En savoir plus.