statistique appliquée

à la gestion et au marketing

Introduction

1. Critique de l’enseignement de la statistique.

Dans la quasi-totalité des programmes pédagogiques des BTS, DUT et des écoles de la filière commerce et gestion, une place importante est accordée aux méthodes de description et de prévision de données statistiques commerciales ou financières. Ces méthodes sont généralement enseignées par des professeurs de gestion ou des professeurs de mathématiques, les premiers insistant sur leur aspect opérationnel et les seconds sur les techniques mathématiques mises en jeu. Cette double approche a pour effet un enseignement souvent mal équilibré.

En outre, la bibliographie actuellement disponible sur ce sujet n’a pas pris en compte la technologie moderne dans la démarche pédagogique et accorde une importance aux techniques de calcul que l’on peut considérer maintenant comme exagérée. Les exercices proposés dans la plupart des ouvrages disponibles ne se prêtent guère à une analyse critique des résultats statistiques : ils permettent d’apprendre à construire un histogramme, à calculer un coefficient de corrélation, etc. Inversement, ils ne sont pas d’un grand secours pour choisir le nombre de classes d’un histogramme,  rechercher les points aberrants dans une série de données, ni pour interpréter correctement les représentations graphiques et les valeurs obtenues.

Les étudiants non scientifiques reculent souvent devant tout développement mathématique, mais ont besoin de la statistique pour leur formation professionnelle et leur activité future ; dès lors, il faut éviter toute formalisation mathématique superflue et insister sur la démarche de l’utilisateur (décrire, prévoir, explorer, …), associer à chacune de ces démarches la méthode statistique adéquate, proposer des canevas de commentaires. C’est en multipliant les exemples, en guidant de façon précise les étudiants dans l’étude des données et la rédaction des commentaires que l’on aboutira à une utilisation raisonnable de la statistique appliquée et à des interprétations correctes des résultats qu’elle produit..

2. La démarche générale.

Ce site internet comble ces lacunes en proposant une démarche de statisticien dans l’approche fondamentale, d’enseignant dans l’approche pédagogique, et de praticien dans les études de cas.

Pour appliquer correctement les méthodes statistiques et bien en interpréter les résultats, il est indispensable au départ de comprendre la démarche intuitive qui a conduit aux formules utilisées : pour cela, nous commençons par une réflexion sur l’objectif recherché (donner un ordre de grandeur d’une série d’observations par exemple), nous indiquons ensuite la démarche fondamentale correspondante  (minimiser une distance pour donner un ordre de grandeur), et en déduisons les définitions et formules (moyenne et médiane). C’est cette démarche que nous qualifions de statisticienne. 

Les démonstrations ne figurent pas dans le texte lui-même ; nous en donnons certaines dans des documents figurant dans les compléments. Les formules sont expliquées au fur et à mesure dans des exemples numériques traités en détail. Les méthodes statistiques sont ensuite concrétisées par des exercices que l’on peut résoudre à l’aide d’une simple calculatrice. Ces derniers ne se limitent pas à de simples applications numériques : ils montrent des propriétés particulières des paramètres statistiques, suscitent une réflexion sur la validité des résultats établis, mettent en garde contre des interprétations trop rapides.

Enfin, les applications pédagogiques, études de cas ou généralisations des méthodes, complètent ces deux aspects en donnant aux étudiants la possibilité d’appliquer des méthodes statistiques sur des données nombreuses, de multiplier les expériences sans difficulté numérique, d’en interpréter les résultats, et d’en rédiger les conclusions dans des conditions proches de la réalité professionnelle.

3. Les méthodes statistiques

Les méthodes présentées dans ce site sont classiques et recouvrent les programmes de statistique de la filière gestion et commerce : statistique descriptive, statistique inférentielle, régression linéaire et analyse des séries chronologiques. Elles sont complétées par une introduction aux méthodes classiques de l’analyse des données et un chapitre d’introduction aux probabilités indispensables à la statistique inférentielle.

Nous avons choisi de présenter en premier les méthodes de statistique descriptive, dont les développements mathématiques sont très limités et qui donnent l’orientation pratique cherchée ici. Dans les trois premiers chapitres, nous donnons des règles simples pour construire les représentations graphiques, choisir le nombre de classes d’un histogramme, comparer des données, analyser la relation entre deux variables. Le praticien devenu averti pourra évidemment s’affranchir des règles d’interprétation proposées.

Le chapitre sur les probabilités précède l’introduction à l’estimation et aux tests statistiques : on définit les notions d ‘événement, de variable aléatoire, de loi de probabilité. Cette présentation est limitée à l’indispensable, c’est-à-dire aux propriétés et aux définitions dont l’application est immédiate en statistique : seules les lois de probabilité élémentaires figurent dans ce chapitre. Elle permet de distinguer la théorie des probabilités, dans laquelle les paramètres théoriques des lois mises en jeu sont connus, et la statistique dont un des objectifs, l’estimation, est au contraire d’attribuer des valeurs approximatives à ces paramètres.

Nous expliquons dans les deux chapitres suivants les méthodes d’estimation, les tests d’indépendance et d’ajustement ainsi que les tests paramétriques élémentaires. La notion de puissance est introduite seulement dans le but de faire prendre conscience aux utilisateurs de l’importance du risque de seconde espèce, et de la signification de l’acceptation d’une hypothèse. On utilise fréquemment dans ces chapitres des procédures de simulation, dont l’avantage est de produire sans limite des données possédant des propriétés fixées a priori. On peut ainsi illustrer les propriétés de convergence et appliquer des tests dans des situations très diverses.

Le modèle linéaire (ou régression des moindres carrés) est l’objet d’une approche critique. Ce modèle étant souvent utilisé de façon très discutable, nous mettons en garde les utilisateurs contre les erreurs les plus fréquentes en proposant une modélisation précise. Un paragraphe important est consacré à la validation du modèle par l’étude des résidus, et nous proposons une introduction à la régression linéaire multiple.

L’analyse élémentaire des séries chronologiques : moyennes mobiles, modèles additif et multiplicatif, désaisonnalisation, est complétée par le filtre de Buys Ballot et des notions sur la prévision à court terme (lissage exponentiel, modèle de Holt et Winters).

L’ouvrage se termine par un chapitre sur l’analyse des données multidimensionnelles (analyse en composantes principales, analyse des correspondances, analyse factorielle discriminante, et classification). Ces méthodes sont maintenant régulièrement utilisées et il nous paraît indispensable que les étudiants en gestion et en marketing en aient des notions suffisamment solides pour en comprendre l’intérêt et les résultats, même si les interprétations restent surtout du domaine du spécialiste.

 

L’auteur espère contribuer par ce site à l’amélioration de l’utilisation de la statistique dans les entreprises et les administrations. La présence de données nombreuses donne aux enseignants l’opportunité de placer les étudiants dans des situations concrètes, de demander les conclusions des analyses sous forme de textes, graphiques et commentaires et de montrer non seulement l’intérêt de la statistique, mais aussi ses limites.