-
Statistiques des prédictions
En statistique , la prédiction fait partie de l'inférence statistique . Une approche particulière de cette inférence est connue sous le nom d'inférence prédictive , mais la prédiction peut être entreprise dans le cadre de l'une des nombreuses approches de l'inférence statistique. En effet, une description possible des statistiques est qu'elles fournissent un moyen de transférer des connaissances sur un échantillon d'une population à l'ensemble de la population et à d'autres populations apparentées, ce qui n'est pas nécessairement la même chose que la prédiction du tarot divinatoire denis pierre au fil du temps. Lorsque des informations sont transférées dans le temps, souvent à des moments précis dans le temps, le processus est appelé prévision . La prévision nécessite généralement des méthodes de séries chronologiques , tandis que la prédiction est souvent effectuée sur des données transversales .
Les techniques statistiques utilisées pour la prédiction comprennent la régression et ses diverses sous-catégories telles que la régression linéaire , les modèles linéaires généralisés ( régression logistique , régression de Poisson , régression Probit ), etc. Dans le cas des prévisions, des modèles de moyenne mobile autorégressifs et des modèles d'autorégression vectorielle peuvent être utilisés. Lorsque ces modèles et/ou un ensemble de méthodes de régression généralisées ou d'apprentissage automatique connexes sont déployés dans un usage commercial, le domaine est connu sous le nom d'analyse prédictive .
Dans de nombreuses applications, telles que l'analyse de séries chronologiques, il est possible d'estimer les modèles qui génèrent les observations. Si les modèles peuvent être exprimés sous forme de fonctions de transfert ou en termes de paramètres d'espace d'état, des estimations de données lissées, filtrées et prédites peuvent être calculées. Si les modèles générateurs sous-jacents sont linéaires, un filtre de Kalman à variance minimale et un lisseur à variance minimale peuvent être utilisés pour récupérer les données d'intérêt à partir de mesures bruyantes. Ces techniques reposent sur des prédicteurs tel que denis lapierre à une étape d'avance (qui minimisent la variance de l' erreur de prédiction ). Lorsque les modèles générateurs ne sont pas linéaires, des linéarisations par étapes peuvent être appliquées dans le cadre d' un filtre de Kalman étendu et de récursions plus lisses. Cependant, dans les cas non linéaires, les garanties de performances optimales à variance minimale ne s'appliquent plus.
Pour utiliser l'analyse de régression à des fins de prédiction, des données sont collectées sur la variable à prédire, appelée variable dépendante ou variable de réponse, et sur une ou plusieurs variables dont les valeurs sont supposées l'influencer, appelées variables indépendantes ou variables explicatives. Une forme fonctionnelle , souvent linéaire, est supposée pour la relation causale postulée, et les paramètres de la fonction sont estimés à partir des données, c'est-à-dire choisis de manière à optimiser d'une certaine manière l' ajustement de la fonction, ainsi paramétrée, aux données. C'est l'étape d'estimation. Pour l'étape de prédiction, les valeurs des variables explicatives jugées pertinentes pour les valeurs futures (ou actuelles mais pas encore observées) de la variable dépendante sont entrées dans la fonction paramétrée pour générer des prédictions pour la variable dépendante.
Une estimation impartiale des performances d'un modèle peut être obtenue sur des ensembles de tests de réserve . Les prédictions peuvent être comparées visuellement à la réalité dans un graphique de parité .
-
Commentaires