Citation du jour:

N'oubliez pas de faire un don. Nous avons besoin de votre aide en ces temps difficiles.Faire un don.

Prévision décisionnelle (Première partie)

Introduction
Parler de prévision, c’est se projeter dans le futur. Le temps est une des dimensions que l’Homme peut percevoir : il a une mémoire. Qui se souvient du passé plus d’une fois peut supposer qu’il existera un autre futur.


La Pythie, assise sur un trépied, rend un oracle
Déjà dans l’Antiquité gréco-romaine, par exemple, l’homme essayait de deviner son avenir (en interrogeant la Pythie, en lisant dans les entrailles d’animaux). Encore aujourd’hui on essaie de décrypter les rêves « prémonitoires », on consulte des voyantes, on essaie de décoder des signes, bons ou mauvais présages.
Deux visions du futur s’affrontent cependant : peut-on influer sur le cours des événements ou pas ? La tragédie antique met en scène le côté inéluctable du destin de chacun. La prévision décisionnelle à l’inverse part du principe que l’on peut influer sur les résultats futurs. En donnant une estimation des chiffres à venir (budgétisation), elle permet d’envisager des stratégies pour atteindre des objectifs prédéfinis.

« L'avenir n'est jamais que du présent à mettre en ordre. Tu n'as pas à le prévoir, mais à le permettre. » Antoine de Saint-Exupéry [1]

Difficulté de la prévision

Prévision

Définition
Prévision : du latin praevisio. Littéralement, voir avant.
En Économie, prévoir signifie étudier ce qui apparaîtra, par exemple un phénomène (tout ce qui peut se manifester à la conscience) ou quelque chose d’une certaine ampleur, en fournissant ou non des chiffres.

Il s’agit d’anticipation du réel, quels qu’en soient la source, le moyen, l’objet, le but. Peu de prévisions se vérifient complètement. On peut considérer que les connotations, les valeurs que l’on donne à des prévisions dépendent de la confiance que l’on accorde au vecteur qui nous les transmet. Confiance qui résultera parfois elle-même d’un degré de probabilité, celui de la réalisation des événements prévus précédemment. Qui a vu juste prévoira juste en quelque sorte : on suivrait comme une intuition que des règles sous-tendraient cet art ou que des modèles se vérifieraient plus que d’autres.

Définition
Prédiction < prédire : du latin præaedicere. Littéralement dire avant. Ce verbe annonçait un ordre, disait quelque chose comme devant se produire.

L’évolution du langage traduit la difficulté de pointer d’avance le futur avec certitude.
Interrogeons-nous quelques instants sur la finalité, le but de ces visions d’anticipation.

Anticipation

Définition
L’anticipation, en Informatique, a pour finalité d’améliorer les performances de la machine grâce à un procédé de traitement particulier. En même temps qu’une instruction est exécutée, l’unité a pour objectif de trouver la suivante. Elle commence donc simultanément la recherche de celle ayant la plus forte probabilité d’exécution. Dans ce cas, deux actions ont lieu en parallèle : une action dans le présent continu et une action pour le futur dans le but de gagner du temps.

Finalité, but, objectif, désignent la cible à atteindre, selon des degrés de précision s’échelonnant du général au particulier.
L’objectif est variable. Le plus souvent le but à atteindre est choisi dans le cadre d’un projet. Or seul le projet est certain, comme l’écrit sous une autre forme Jules RENARD dans son Journal du 2 février 1902. Lequel des brouillons sera la copie finale ?
Sur un échiquier, avoir plusieurs coups d’avance est une qualité du joueur. A partir de la situation de jeu, le professionnel cherche et recherche en permanence les combinaisons futures possibles. Il leur attribue des probabilités. Il choisit enfin une option en fonction des chances de faire échec et mat.
On peut parler de prévision décisionnelle lorsque le but de l’anticipation ou de la prévision est de prendre une décision parmi les vues envisagées, avec pour finalité une correspondance forte entre projet et avenir.

Déterminisme: de cause à effet

Citation
[L’avenir] n'est jamais que du présent à mettre en ordre. […] L'avenir, tu n'as point à le prévoir mais à le permettre. Citadelle, Antoine de Saint-Exupéry, éd. Gallimard, coll. NRF, 1948, chap. LVI, p. 167
Antoine de Saint Exupéry dans Citadelle (1948, œuvre posthume) parle du présent comme de matériaux pour un bâtisseur. A partir de ceux-ci, il s’agit de construire l’avenir.
voir citations extraites de l'oeuvre posthume de Saint Exupéry, Citadelle (1948)
Dans ce livre, Antoine de Saint Exupéry semble écrire du point de vue de ceux qui ne souhaitent pas subir l’avenir.
On simplifierait à orienter ceux qui cherchent à prévoir entre deux pôles, dont l’un serait la tragédie. Tous ont un rapport avec le déterminisme. En effet, des causes aux conséquences, tout dépend du poids que l’on associe aux actions, aux interactions, à chaque élément qui compose l’univers des combinaisons possibles. Il y a de multiples variables possibles mais…
  • Ceux qui seraient soumis au pôle tragique ne pourraient changer leur avenir, contrairement aux autres. Dans les tragédies antiques et pour simplifier, quoi que fasse l’homme, il est soumis à un certain destin. Il peut le connaître plus ou moins mais quoi qu’il fasse, il ne peut y échapper. Quelque part, le lien de cause à effet échappe au sujet mais ce dernier est mené là où il est prédit qu’il se rendra. Tout s’enchaîne sans variation possible. Aucune probabilité de non réalisation d’un événement.
  • Un univers dans lequel rien ne serait certain d’avance serait à l’opposé de ce pôle.
A noter qu’en mathématiques, même les univers aléatoires sont étudiés et mis en théorèmes, en équations.
La plus grande difficulté de la prévision serait donc de connaître tous les paramètres dans un univers, avant même de tenter de prévoir son évolution, pour ceux qui espèrent encore le maîtriser...

La prévision consiste à tenter de s’appuyer sur des enchaînements logiques en les supposant reproductibles. Cela suppose des liens entre des données. Il importe donc de commencer par trouver des données.

Sommaire

Les données

Le choix des données

Elles doivent donc être accessibles, partagées autant que nécessaire, de bonne qualité, fiables, suffisamment précises.
Les données peuvent être entre autres:
  • issues de multiples sources, internes ou externes,
  • datées. À noter que des logiciels comme SAP permettent d’avoir des données sur les mêmes périmètres à des temps différents,
  • obtenues sous différents formats.
Confronter des données les unes aux autres nécessite de les convertir dans des formats compatibles. Une base de données centralisée fait gagner du temps et permet de limiter les erreurs de saisie des opérateurs. Virus, pertes de données, codages et brouillages perturbent aussi le stockage et l’utilisation des données.

Le phénomène Big Data

Des utilisateurs de plus en plus nombreux produisent et parcourent de plus en plus de données. Dans les années 2010-2020, l’expansion des masses d’informations va confronter les matériels à de nouveaux ordres de grandeurs à tous les niveaux de stockage (y compris datawarehousing) et de traitement des données, ainsi que dans les gestions de réseaux.
Aux caractéristiques précédentes des données s'ajoute le fait que :
  • les données ne sont plus forcément organisées avec des tables,
  • elles sont produites en temps réel,
  • elles sont en liens divers avec d’autres données (heure, localisation) de façon très désordonnée,
  • elle arrivent en flot ininterrompu du monde entier.

L’extraction de données

Il est important de rester simple dans le traitement des données, cela permet une meilleure prise en main des fichiers ou des logiciels. Anticiper les consolidations, les insertions de tableaux croisés dynamiques sous Excel, anticiper le traitement des données en général permet de gagner du temps. Dans SAP, différents types d’exportation de données sont possibles.
De même, l’intégration des logiciels permet une meilleure coordination et évite les conflits entre logiciels ou la multiplication des interfaces.
Le choix des données à extraire s’effectue en fonction de l’univers de référence défini. Celui-ci sera le plus restreint possible. Trop de précision fait parfois perdre du temps au détriment de la réactivité. En effet, le volume des données doit être maîtrisable, ainsi que les flux de données à chaque mise à jour. Un logiciel adapté au volume traité est requis. En théorie de la connaissance, pour passer d’une donnée à une information on considère qu'un minimum de contextualisation est cependant nécessaire.

Découverte de modèles

Il est nécessaire d’étudier les données pour trouver des informations. Grâce aux informations, on peut comprendre les rapports de causalité ayant entraîné des variations si celles-ci répondent à un modèle, avant de l’utiliser. En théorie de l’information, c’est le moins probable qui contient le plus d’information. Maintenant, les entreprises analysent souvent les données en temps réel pour connaître leurs projections de résultats à venir.

Définition
Modélisation mathématique: c'est le fait de mettre en équation un phénomène afin de pouvoir prévoir ses évolutions. Il est nécessaire pour trouver des modèles fiables d' :
  • identifier les variables les plus influentes sur le résultat testé : les facteurs clés de succès ou d’échec. Le but d’un modèle est de pouvoir tester des situations en modifiant les valeurs des variables (fonctions, fonctions dérivées).
  • Identifier les constantes pour les neutraliser
Pour autant, l’entreprise reste soumise à des événements imprévisibles, exceptionnels. Il importe de garder une qualité de jugement dans l’analyse et l’élaboration des processus.

Définition
L'Informatique décisionnelle désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données d’une entreprise en vue d’offrir une aide à la décision et de permettre aux responsables de la stratégie d’une entreprise d’avoir une vue d’ensemble de l’activité traitée.
Les Systèmes Informatiques d’Aide à la Décision ou Executive Information System.
Outils privilégiés du Pilotage et de la Stratégie dans les entreprises, leurs objectifs sont:
  • l'analyse du passé
  • la transformation de l’information en connaissance
  • la prévision
  • la recherche d'informations cachées.
Ils s’appuient sur les Programmes de Gestion Informatisée. Ils n’utilisent pas uniquement les échantillons de données (à la différence de la statistique), mais aussi les techniques d’HyperCube et de DataMining.

L’hypercube ou On Line Analytical Processing

L'OLAP (exemple le TCD d’excel) permet de manipuler les données à travers plusieurs dimensions. Zoom/ dézoom, rotation, tranchage (slicing ou scoring) sont des actions qui permettent de les présenter de façon exploitable pour l’analyste ou le décideur. Il y a plusieurs appellations des hypercubes selon leurs applications :
  • U-OLAP > intrus
  • O-OLAP> objet
  • M-OLAP> multidimensionnel
  • R-OLAP> Relationnel
  • H-OLAP> Hybride

Le data mining (webmining sur les sites internet) ou fouille de données

Ensemble de techniques et de méthodes du domaine :
  • des statistiques,
  • des mathématiques,
  • de l’informatique,
permettant à partir d’un important volume de données brutes :
  • le repérage de comportements,
  • la mise en évidence d’ensemble d’individus dans une population spécifique,
  • l’aide aux décideurs d’une entreprise,
  • la découverte de connaissances cachées.
Différentes techniques ou méthodes existent :
  • Réseaux de neurones (exemple Dell, méthode supervisée et non supervisée)
  • Arbres de décisions (exemple Google, méthode supervisée ou prédictive)
  • Nuées dynamiques (exemple Amazon, méthode non supervisée)
  • Probabilités (méthode supervisée ou prédictive)
À titre d’exemple, voici quelques logiciels SIAD : BO de SAP, SAS, Forests and Trees, Hyperion Essbase d’Oracle, Power Play d’IBM. Côté logiciels libres, Birt et Pentaho sont spécialisés en report, Talend en datawarehousing, Tanagra en data mining, Mondrian et Jpivot en hypercube.

Les limites des modèles

Malgré les méthodes de prévision, il peut arriver que subsistent:
  • un flou total,
  • des postulats restant à démontrer comme vrais ou faux,
  • des données non productrices de schémas susceptibles de se reproduire.
De plus, les modèles doivent être mis à jour afin de s'adapter aux changements.
Dans un contexte qui évolue trop rapidement, la réactivité ne se maintient qu'avec un degré de précision moindre.
À noter: plus l’historique est important, plus les modèles sont censés être fiables. Autrement dit, une entreprise gagne sur le long terme à investir dans de bons systèmes de stockage de données.

Un exemple de modèle démontré

Deux chercheurs, LIN Ping-Chen (Université nationale des sciences appliquées de Kaohsiung) et CHEN Jiah-Shing (Université centrale de Taïwan), ont conçu autour de 2008 un algorithme très précis en réutilisant certains principes de l'évolution biologique. Ils le testent sur les données recueillies auparavant jusqu'à trouver le poids approprié de chaque variable permettant de trouver les résultats actuels.
Toute prévision gagne à être confrontée à des informations subjectives. Qu’en pensent les décideurs ? Comment voient-ils les évolutions du marché ?