Objectifs du cours Introduction à l’économétrie

mellowfetaSecurity

Jun 19, 2012 (5 years and 4 months ago)

707 views

Introduction à l’économétrie
Philippe Polomé,Prof.U.Lyon 2
www.gate.cnrs.fr/perso/polome
Année 2010
Objectifs du cours
!
Introduction à l’économétrie
!
Acquérir une compréhension permettant
!
de poser un regard critique sur des résultats
!
d’obtenir quelques résultats
!
Acquérir un minimum de maniement de logiciels (au moins dans
la compréhension des sorties logicielles)
!
Tableur (OO calc,MS excel)
!
Gretl
Organisation
!
Cours magistraux
!
Pas de TD mais démonstration de pratique en cours
!
2 ou 3 devoirs sur logiciel à rendre dans la semaine (avant le
cours suivant) via le FORUM
!
Toutes les communications passent par le forum(voir ma page
)
!
Evaluation
!
Les devoirs valent +/- 5 points
!
Les devoirs ne seront pas corrigés
!
Le reste (15 points) à l’examen
!
Examen de compréhension,sans calcul,sans logiciel
!
Dont une partie sur les devoirs
Logiciels
!
Logiciels économétriques installés en salle info:
!
Stata (le plus populaire actuellement?)
!
SAS (ne développe plus guère l’économétrie,apparemment)
!
Gretl
!
Avantages de Gretl
!
Gratuit et open source,peut être téléchargé et installé sur
vos
ordinateurs personnels Gretl @gretl.sourceforge.net/
!
S’installe dans la langue de votre système opérationnel (an
glais,
français,italien,espagnol,polonais,allemand et portug
ais).
!
Extras (= jeux de données)
!
Maniement similaire à Stata et sorties “standards”
!
Bonne interface graphique
!
Connecte avec divers autres logiciels pour analyse plus pou
ssée
ou sorties de présentation
Références
!
Econométrie,Régis Bourbonnais,Dunod,2002
!
Bonne vision très synthétique en français
!
A Guide to Modern Econometrics,Marno Verbeek,Wiley,2000
!
Plus avancé,nombreux exemples à données réelles,toutes
disponibles dans Gretl
!
Introductory econometrics for finance,Chris Brooks,Cambr
idge
University Press,2002-2005
!
Pas trop avancé,orienté finance
!
Wooldridge,J.Introductory Econometrics
!
Beaucoup d’exemples,large public
Chapitre 1
Ce qu’on a et ce qu’on veut faire
Une introduction intuitive
Un exemple
Ce qu’on a et ce qu’on veut faire
!
On a un modèle
causal stochastique
!
S’il fait plus chaud (
X
:la température),la consommation de
crème glacée (
Y
) augmente,toutes autres choses égales
!
Y
t
=
!
1
+
!
2
X
t
+
"
t
!
pour chaque
t
=
1
...
T
!
avec erreurs aléatoires non-observables
"
t
!
On a des données
!
La variable
Y
dite endogène ou expliquée
!
Une ou plusieurs variables
X
1
...
X
k
explicatives
!
On veut
!
Quantifier l’influence de
X
sur
Y
!
Prédire
Y
conditionnellement à certaines valeurs pour
X
!
Comment faire?
Intuition 1:Droite qui « passe au mieux »
Intuition 1:Droite qui « passe au mieux »
!
Y
t
=
!
1
+
!
2
X
t
+
"
t
pour chaque
t
=
1
...
T
!
Y
=
X
!
+
"
en notation matricielle
!
On suppose que c’est la relation réelle
!
"
s’interprète comme un événement aléatoire
!
non-mesuré
!
non-systématique
!
On cherche une estimation
ˆ
!
de
!
telle que la droite
Y
t
=
ˆ
!
1
+
ˆ
!
2
X
t
+
"
t
“passe au mieux” dans le nuage de points
!
soit l’erreur
ˆ
"
=
Y
!
X
ˆ
!
!
On cherche le vecteur de nombres
ˆ
!
tel que la somme des carrés
des erreurs
#
T
t
=
1
!
Y
y
!
X
t
ˆ
!
"
2
soit minimale
!
Réponse
ˆ
!
=
!
X
"
X
"
!
1
X
"
Y
!
Compliqué à calculer donc logiciel
!
ˆ
!
est un ESTIMATEUR,dit « des moindres carrés »
Intuition 2:« Inversion » de
Y
=
X
!
+
"
!
Imaginons que
"
=
0
et que
X
soit carrée et inversible
!
Alors
X
!
1
telle que
X
!
1
X
=
I
existe
!
!
=
X
!
1
Y
s’obtient par inversion (système d’équations linéaires)
!
Mais
"
#
=
0
et
X
n’est pas carrée
$
« Généralisation » de
l’inverse
!
Prémultiplier par
X
"
,on a
X
"
Y
=
X
"
X
!
+
X
"
"
!
X
"
X
est carrée et “souvent” inversible (à une condition)
!
Hypothèse:
"
n’est pas corrélé à
X
,
c’est-à-dire
X
"
"
=
0
.
!
Alors
X
"
Y
=
X
"
X
!
et donc
!
=
!
X
"
X
"
!
1
X
"
Y
!
En général,
X
"
"
#
=
0
mais si on peut supposer que
X
"
"
%
0
en un
sens stochastique,alors on peut écrire
ˆ
!
=
!
X
"
X
"
!
1
X
"
Y
dans le
sens où
ˆ
!
est une approximation de
!
Estimateur « méthode des moments »
!
L’inversion est une intuition d’un autre estimateur,dit “m
éthode
des moments”
!
Soit
A
un estimateur de
!
,alors on peut écrire
Y
!
XA
=
ˆ
"
.
!
On veut que
A
soit tel que
X
"
ˆ
"
%
0
!
Alors
A
=(
X
"
X
)
!
1
X
"
Y
=
ˆ
!
:
!
Estimateur MM= estimateur MCO pour le modèle linéaire
Y
=
X
!
+
"
!
Mais la méthode des moments s’applique pareillement à des
modèles non linéaires
Y
=
g
(
X
,
!
) +
"
L’exemple de la crème glacée
!
L’exemple calculé dans Excel
!
L’exemple calculé dans Gretl
La prédiction
!
Un objectif était de prédire au mieux les ventes de crème glac
ée
en fonction de la température
!
La prédiction se trouve sur la droite:
ˆ
Y
=
X
ˆ
!
!
Un second objectif était la quantification de l’influence de
X
sur
Y
!
$
Y
/
$
X
1
=
!
1
= coefficient de
X
1
= pente de la droite
!
Se vérifie dans la prédiction
!
Exemple dans Excel et Gretl
/Users/polome/Documents/Teach&Org/M1FinEcntxintro/S
lides2010/pasted3.png
Exemples à données réelles
Exemples à données réelles
!
Trois types de données
!
Séries temporelles (Time series):un agent,beaucoup de pér
iodes
!
Coupe transversale (Cross-section):beaucoup d’agents,u
ne
période
!
Panel:beaucoup d’agents,quelques périodes (MCO peu
adaptés!)
!
Gretl contient de nombreuses bases de données réelles,util
isées
dans des textes de références (dont Verbeek)
!
Exemple consommation de crèmes glacées icecream.gdt dans
Verbeek dataset
Séries temporelles dans Gretl
!
Macroeconomics data,several decades,trimestriel,Austr
alia,
Europe,Danemark,UK...dont:prix,déflateurs,emplois,
population,croissance,investissement,éducation...
!
Daily percentage nominal returns for the DM/British £ excha
nge
rate – 03/01/84:31/12/91
!
Monthly data on international airline passengers,1949-19
60
!
Daily/Weekly stock price data (closing value of the Dow-Jon
es
or NYSE) for several periods
!
Consumption and rate of return on portfolios,mensuel,1959
-97
!
...
Coupes transversales dans Gretl
!
Strike duration data,in days
!
Votes on ratification of Microsoft’s"Office Open XML"as an
ISO standard,September 2007
!
Choix de plan de pension en fonction de caractéristiques
socio-économiques
!
Dégâts à des bateaux
!
Nombre de visites chez le médecin
!
...
Panel dans Gretl
!
140 U.K.manufacturing companies over the period 1976-1984
!
Employment and schooling history for a sample of men for the
years 1981 to 1987
!
...
Où trouver des données réelles?
!
Finance
!
What Was the Exchange Rate Then?- historical exchange rates
:
http://www.measuringworth.org/exchangeglobal/
!
Bond Market Association - material on this important market
:
http://www.bondmarkets.com/
!
Center for Research in Security Prices (CRSP) - key security
price data set:http://www.crsp.com/
!
CRSP Data Access and Analysis - suggestions on using CRSP:
http://web.mit.edu/doncram/www/crsp.html
!
Financial Data Finder (FDF) - lists numerous financial data s
ets:
http://fisher.osu.edu/cgi-
bin/DB_Search/db_search.cgi?setup_file=finance.setup.
cgi
!
Global Financial Data - historical finance,price,and forei
gn
exchange data:https://www.globalfinancialdata.com/
!
OSU Virtual Finance Library - nice listing of finance sites fo
r
academics:http://fisher.osu.edu/fin/overview.htm
!
SEC EDGAR - electronic filings with the SEC (U.S.Securities
and Exchange Commission):http://www.sec.gov/edgar.sht
ml
!
TickPlus Data - very detailed financial market data:
http://www.regisdata.co.uk/tickdata.htm
Où trouver des données réelles?
!
En France:données des grandes enquêtes publiques
(consommation,logement,revenu,...)
!
Centre Quételet:http://www.centre.quetelet.cnrs.fr/
!
Plateforme de diffusion de données SHS:
http://www.ish-lyon.cnrs.fr/DATA_SHS/index_fr.php
!
INSEE:http://www.insee.fr/fr/default.asp
!
Autres:voir mon site
http://www.gate.cnrs.fr/spip.php?article205
Distribution d’échantillonnage &Propriétés
Distribution d’échantillonnage
!
Chaque échantillon est aléatoire
!
Exemple de la vente de crème glacée sur la plage
!
Un autre vendeur sur autre plage aurait récolté des données
différentes
!
La méthodologie présentée auparavant est applicable
quand-même
!
Le modèle est le même...mais les valeurs des coefficients ser
ont
différentes dans les deux cas!!
!
Echantillon aléatoire =>
ˆ
!
aléatoire alors que
!
ne l’est pas!
!
Quel est le
ˆ
!
correct?Tous les deux sont corrects
!
Tous les deux sont entachés d’une marge d’erreur par rapport
au
« vrai » coefficient
!
Distribution d’échantillonnage
!
Exemples dans OpenOffice/Excel:
simulation de
Monte-Carlo
!
Dans une simulation de Monte-Carlo,on génère (crée) des
données artificielles afin d’illustrer certains outils théo
riques dans
un cadre contrôlé
!
Fonction alea() (si vous avez une version anglaise:rand())
:crée
une valeur tirée d’une variable aléatoire de distribution u
niforme
entre 0 et 1
!
SQRT(-2*LN(alea()))*SIN(2*PI()*alea()) crée une valeur
d’une
normale de moyenne 0 et d’écart-type 1
!
Avec ces fonctions,on génère X et le terme d’erreur
!
Ce qui permet de calculer Y = 2-3X+erreur (ou tout autre choix
de coefficient)
!
On répète l’opération 10 lignes (par exemple)
!
En utilisant Y et X on estime
ˆ
!
,on voit bien que
ˆ
!
#
=
!
!
En recommencant l’opération,on crée des vecteurs
ˆ
!
i
qui sont
tous différents les uns des autres et tous différents de
!
:les
ˆ
!
i
sont tous aléatoires (alors que
!
ne l’est pas,mais l’erreur et X le
sont)
Distribution d’échantillonnage
!
ˆ
!
aléatoire:conséquences
!
Il n’y a pas de garantie d’être proche des vrais valeurs
!
On caractérise un estimateur en fonction de ses
propriétés
!
Un estimateur sera jugé meilleur qu’un autre si ses propriét
és
sont meilleures
!
Biais
!
Consistence (
cohérence
)
!
Efficience
Propriété désirable 1:absence de biais
!
La moyenne des coefficients estimés (sur l’ensemble des
échantillons dans Excel) tend à se rapprocher des vrais
valeurs
!
Estimateur moindres carrés est dit
non-biaisé
!
« En moyenne,cet estimateur ne se trompe pas » (pour autant qu
e
le modèle choisi soit le bon)
E
!
ˆ
!
"
=
E
#
!
X
"
X
"
!
1
X
"
Y
$
=
E
#
!
X
"
X
"
!
1
X
"
(
X
!
+
"
)
$
=
E
#
!
X
"
X
"
!
1
X
"
X
!
$
+
E
#
!
X
"
X
"
!
1
X
"
"
$
=
E
(
!
) +
E
#
!
X
"
X
"
!
1
X
"
$
E
(
"
) =
!
!
pour autant que
!
X
et
"
soient indépendants (alors l’espérance de leur produit = le
produit des espérances)
!
E
(
"
) =
0
(on verra plus tard que c’est toujours vrai)
!
E
!
ˆ
!
"
%
moyenne
!
ˆ
!
"
lorsqu’il y a beaucoup d’échantillons
Propriété désirable 2:consistence
!
Plus la taille de l’échantillon grandit,plus les coefficien
ts
estimés tendent à se rapprocher des vrais valeurs
!
L’estimateur moindres carrés est dit
consistent
!
Lorsque la taille de l’échantillon tend vers l’infini,les co
efficients
estimés convergent vers les vrais valeurs
!
On écrit:
Plim
!
ˆ
!
"
=
!
Propriété désirable 3:efficience
!
L’efficience d’un estimateur est sa précision (l’inverse de
sa
variance)
!
On verra la mesure précise plus tard
!
On ne s’intéresse à l’efficience que des estimateurs:
!
Non-biaisés pour les petits échantillons
!
Consistents pour les grands (on parle de:“asymptotiquemen
t
efficient”)
!
L’efficience est
comparative
:un estimateur par rapport à un
autre
!
L’estimateur MCO est le plus efficient des estimateurs linéa
ires
non-biasés
/
consistents
Devoir#1
!
Réaliser votre propre exemple de Monte Carlo dans Excel (ou
OpenOffice ou NéoOffice ou Gretl ou Stata)
!
Avec 2 régresseurs,un distribué uniformément dans
[
0
,
1
]
et
l’autre distribué normalement
n
(
0
,
1
)
,une constante et un terme
d’erreur distribué
n
(
0
,
1
)
!
Choisissez les valeurs des coefficients
!
Tout le monde devrait avoir des chiffres différents
!
Calculez les coefficients avec les formules
!
X
"
X
sera 3x3 et
ˆ
!
sera 3x1
!
Poster le devoir
sur le forum
avant le prochain cours (jeudi au
plus tard) sous forme d’un seul fichier Excel (ou OpenOffice ou
NéoOffice ou Gretl ou Stata) par personne
!
Je ne prends pas en compte les fichiers envoyés autrement
!
On ne corrigera pas le devoir
Chapitre 2:
Le modèle classique de régression linéaire
Causalité contre corrélation
!
Modèle causal:
X
cause
Y
,
X
influence
Y
!
Pas le contraire
!
Ce n’est pas la même chose qu’une corrélation
X
corrélé à
Y
&
Y
corrélé à
X
!
Dans l’exemple des ventes de crème glacée,la température ca
use
les ventes
!
Un accroissement de température provoque un accroissement
de
demande
!
Évidemment,ce n’est pas parce que les gens mangent plus de
glaces que la température va augmenter
!
Dans des modèles plus sophistiqués,cette causalité est loi
n
d’être évidente
!
En macro,le taux de change agit-il sur la balance commercial
e ou
est-ce l’inverse?
!
En marketing,au niveau de la firme,les ventes et les dépenses
de
publicité sont dites simultanées:chacune est cause de l’au
tre
!
La demande d’un produit (quantité) dépend du prix,mais
l’inverse est vrai aussi (simultanéité)
Causalité contre corrélation
!
La régression ne mesure que des corrélations
!
Elle n’a de sens causal que pour confirmer ou infirmer un modèle
!
(Il est existe des tests de causalité applicables dans certa
ines
circonstances)
!
Exemple de régression inverse dans le cas des crèmes glacées
:
X
1
=
%
1
+
%
2
Y
+
"
!
Excel et Gretl
!
Ce que ça veut dire:une régression ne dit à elle seule rien
d’autre que des corrélations
!
Pour y voir des relations économiques,il est nécessaire qu’
elle
soit accompagnée d’une théorie
!
Exemple des cigognes
Les moyennes conditionnelles
!
Exemple de tableau croisé dynamique
!
Les moyennes conditionnelles sont des moyennes (arithméti
ques
simples) calculées sur un groupe particulier dans l’échant
illon
!
Par exemple:les ventes moyennes du vendeur Smith dans une
entreprise
!
Il est possible de croire que les différences entre moyennes
conditionnelles sont dues aux “conditionneurs”
!
Par exemple,les ventes de Smith sont plus élevées que celles
de
González parce que Smith est meilleur vendeur que González
!
Mais il ne s’agit que d’une corrélation,pas d’une causalité
!
Par exemple,les ventes de Smith sont plus élevées parce que i
l est
sur un plus grand territoire
Causalité:conclusion
!
L’économétrie,les moyennes conditionnelles,les corréla
tions ne
servent qu’à
quantifier
,pas à expliquer.
!
De telles quantifications peuvent confirmer ou infirmer une
théorie (parfois)
!
Par exemple,si la théorie est “les hommes sont meilleurs
vendeurs que les femmes”,on peut comparer les ventes des
hommes et des femmes pour infirmer cette théorie
!
Mais il ne faut pas accepter n’importe quel résultat juste pa
rce
qu’il a été obtenu par des méthodes sophistiquées
Le modèle économétrique formel
Une section de nomenclature
Le modèle économétrique formel
!
Y
t
=
!
0
+
!
1
X
1
t
+
...
+
!
k
X
kt
+
"
t
!
t
=
1
...
T
indexe les observations
!
Y
est la variable endogène,expliquée,dépendante
!
Chaque
X
i
avec
i
=
1
...
k
est une variable explicative ou causale,
un régresseur (pas nécessairement exogène)
!
Y
t
=
!
0
+
!
1
X
1
t
+
...
+
!
k
X
kt
est une
théorie
!
Chaque
!
i
mesure quantitativement l’influence de
X
i
sur
Y
!
!
i
est la
pente
de la droite selon
X
i
!
!
0
est dit constante,terme indépendant ou intercept du modèle
!
!
est le vecteur de coefficients du modèle
!
Le terme d’erreur s’écrit souvent
"
ou

!
Il a plusieurs interprétations:erreurs de mesures,régres
seurs
inobservables ou manquants,facteurs aléatoires...
Le modèle économétrique formel
!
En notation matricielle
Y
=
X
!
+
"
!
On observe
Y
et
X
!
L’économétrie est un ensemble de techniques pour estimer
!
!
Chaque technique donne lieu à une formule,qu’on appelle
« estimateur » et qu’on note avec un chapeau
!
Par exemple « Moindres carrés ordinaire »
ˆ
!
=
!
X
"
X
"
!
1
X
!
1
Y
!
Il existe également des estimateurs « maximumde
vraisemblance »,« méthode des moments »,« variables
instrumentales »,« moindres carrés généralisés »...
Le modèle économétrique formel
!
La prédiction s’écrit
ˆ
Y
=
X
ˆ
!
!
Il y a bien sûr toujours une erreur de prédiction
!
On n’observe jamais le terme d’erreur
"
!
Par contre,on calcule le résidu
ˆ
"
=
Y
!
ˆ
Y
=
Y
!
X
ˆ
!
!
Ce résidu s’écrit parfois
e
et peut se nommer « erreur » (mais ça
porte à confusion)
!
Exemple Excel
Modèle classique de régression linéaire:7 hypothèses
Les circonstances dans lesquelles MCO est un “bon”estimate
ur
Modèle classique de régression linéaire:7 hypothèses
!
Le Modèle Classique de Régression Linéaire (MCRL) est le
modèle qu’on a utilisé jusqu’à présent,soit,en notation
matricielle
Y
=
X
!
+
"
!
Ce modèle s’accompagne de 7 hypothèses classiques
!
Lorsqu’elles sont vérifiées,l’estimateur MCO possède de tr
ès
bonnes propriétés
!
On va examiner ces hypothèses
!
Voir dans quels cas elles ne sont pas satisfaites
!
Voir si les conséquences sur l’estimateur sont graves
!
Voir si on peut “réparer”
MCRL
Y
=
X
!
+
"
:7 hypothèses
1.
E
(
"
t
) =
0
'
t
:les erreurs ont une
espérance nulle
!
Cette propriété est toujours satisfaite pour autant qu’il y
ait une
constante
!
0
dans la régression (commande MC dans excel)
2.
var
(
"
t
) =
&
2
'
t
:la variance de chaque erreur est la même et est
réelle =
Homoscédasticité
3.
cov
(
"
t
,
"
s
) =
0
'
t
#
=
s
:les erreurs sont indépendantes entre elles
=
Pas d’auto-corrélation
!
1+2+3 = “Sphéricité des erreurs”
4.
E
(
"
t
x
t
) =
0
'
t
:il n’y a pas de corrélation contemporaine
(même t) entre l’erreur et chaque régresseur =
Exogénéité
F
IGURE
:
MCRL
Y
=
X
!
+
"
:Illustration graphique des 4 hyp.sur l’erreur
®Wooldridge
MCRL
Y
=
X
!
+
"
:7 hypothèses
!
5.La matrice X est de plein rang
!
Aucun régresseur ne peut s’écrire comme une combinaison
linéaire des autres régresseurs
!
Dans le cas contraire,on parle de colinéarité parfaite des
régresseurs
!
Dans ce cas,
X
"
X
n’est pas inversible
!
6.Le modèle est correctement spécifié
!
La réalité est effectivement linéaire en les coefficients (f
orme
fonctionnelle)
!
Il ne manque aucun régresseur pertinent
!
7.La variable dépendante
Y
est continue
!
Pas qualitative:0/1 ou bien A,B,C,D
!
Pas discrète:0,1,2,3...
!
Pas tronquée/censurée:[3,12] ou [-1,+1]
Hypothèses pas respectées => MCOperd certaines de ses propr
iétés
(Chap 4)
MCRL
Y
=
X
!
+
"
:3 Propriétés de l’estimateur MCO
Si toutes les hypothèses du MCRL sont respectées,l’estimat
eur MCO
possède les propriétés suivantes
!
Non-biaisé
E
!
ˆ
!
"
=
!
!
La moyenne sur suffisamment d’échantillons des estimations
MCO est égale à la vrai valeur des coefficients
!
Consistent
:A mesure que l’échantillon grandit,l’estimation
MCO se rapproche de la vrai valeur des coefficients
!
En abrégé
Plim
!
ˆ
!
"
=
!
!
Efficient
(précision)
!
Un estimateur linéaire est dit efficient si sa variance est la
plus
petite de tous les estimateurs linéaires
!
Théorème de Gauss-Markov:cette variance est la plus petite
de
tous les estimateurs linéaires non-biaisés:
ˆ
!
est
BLUE
!
De plus,
ˆ
!
est le plus efficient de tous les estimateurs consistents:
ˆ
!
est
asymtotiquement efficient
Chap 6 Variables dépendantes limitées
6.1 Modèles dichotomiques
!
Dans beaucoup de situations économiques,on souhaite expli
quer
une variable endogène dichotomique
!
Acheter ou non,Être employé,Voter
!
Aller à l’université,quelle orientation...
!
Souvent il s’agit de situations micro (individus,ménages,
firmes)
!
Le modèle linéaire n’est pas approprié
Y
i
=
X
i
!
+
"
i
avec
Y
i
(
{
0
,
1
}
!
implique qu’il faudrait contraindre les
!
de telle sorte à ce que
ˆ
Y
i
(
{
0
,
1
}
'
i
!
pas à priori possible (trop de contraintes)
Modèle de probabilité
!
Au lieu “d’expliquer” une variable endogène dichotomique,
on
propose un modèle d’estimation de la probabilité que la vari
able
endogène soit =1 en fonction de variables explicatives
!
Pr
{
Y
i
=
1
|
X
i
}
=
F
(
X
i
!
)

!
F
est une fonction de distribution
!
X
i
!
est dit fonction index
!
Pr
{
Y
i
=
0
|
X
i
}
=
1
!
F
(
X
i
!
)
!
2 principaux exemples
!
Logit
F
(
X
i
!
) =
!
(
X
i
!
) =
exp
(
X
i
!
)
1
+
exp
(
X
i
!
)
!
Probit
,basé sur la normale standard
F
(
X
i
!
) =
"
(
X
i
!
) =
ˆ
X
i
!
!
'
1
)
2
(
exp
%
!
t
2
/
2
&
dt
!
Remarque:argument linéaire des fonctions = Modèle linéair
e
général
Interprétation
!
Le signe du coefficient d’un régresseur
x
j
indique le sens de la
variation de
Pr
{
Y
i
=
1
}
lorsque ce régresseur s’accroît.
!
Pour avoir une idée quantitative de cette variation,on doit
avoir
recours aux dérivées:
!
Probit
$
"
(
X
i
!
)
$
x
ji
=
)
(
X
i
!
)
!
j

)
()
est la fonction de densité
normale standard (dans tous les tableurs)
!
Logit
$
!
(
X
i
!
)
$
x
ij
=
!
(
X
i
!
)
!
j
1
+
exp
(
X
i
!
)
!
Attention:le modèle est non-linéaire,les effets sont
individuels!
!
Gretl calcule les effets à la moyenne des régresseurs,ce n’e
st pas
la même chose que l’effet moyen!
Modèle sous-jacent
!
Il est souvent utile,pour l’interprétation et la compréhen
sion,
d’obtenir le modèle de choix dichotomique à partir d’hypoth
èses
comportementales
!
Exemple de l’achat d’un bien
!
Soit l’utilité individuelle
Y
*
i
=
X
i
!
+
"
i
de l’achat de ce bien
!
X
représente des caractéristiques observables individuell
es ou
bien des caractéristiques observables du bien (selon les ca
s,pas
les deux)
!
"
représente les caractéristiques inobservables
!
Y
*
est dit variable latente car elle ne peut être observée,on
n’observe que la décision
Y
(
{
0
,
1
}
!
On fait l’hypothèse que l’individu achète le bien si son util
ité
dépasse un certain seuil,normalisé à zéro – donc:
Pr
{
Y
i
=
1
}
=
Pr
{
Y
*
i
>
0
}
=
Pr
{
X
i
!
+
"
i
>
0
}
=
Pr
{
!
"
i
<
X
i
!
}
=
F
(
X
i
!
)
Estimation
!
Le modèle est non-linéaire en
!
et la variable endogène n’est pas
continue
!
MCO n’est pas approprié
!
Principes du maximumde vraisemblance
!
On suppose connue la distribution du terme d’erreur,p.e.
"
+
n
()
!
Hypothèse:l’échantillon observé est le plus probable
!
Principe:on veut
ˆ
!
t.q.la probabilité estimée de l’échantillon est
maximale
!
Quelle est la probabilité de l’échantillon?
!
Hypothèse:les observations sont indépendantes entre elle
s
!
Donc:la probabilité de l’échantillon est le produit des
probabilités de chaque observation,c’est la fonction de
vraisemblance:
*
Y
i
=
0
Pr
{
Y
i
=
0
}
*
Y
i
=
1
Pr
{
Y
i
=
1
}
!
On réécrit souvent pour plus de simplicité
*
i
(
Pr
{
Y
i
=
0
}
)
1
!
y
i
(
Pr
{
Y
i
=
1
}
)
y
i
Maximumde vraisemblance
!
Généralement on prend le
ln
car la forme est plus simple à
optimiser
ln
L
(
!
) =
#
i
(
1
!
y
i
)
ln
(
1
!
F
(
X
i
!
)) +
y
i
ln
(
F
(
X
i
!
))
!
Résolution numérique par ordinateur,essentiellement
!
À partir de valeurs de départ pour
ˆ
!
,l’ordinateur calcule la valeur
de la fonction
!
Puis,prend un autre vecteur de valeurs selon une certaine rè
gle et
recalcule la valeur de la fonction
!
Il poursuit ainsi tant que
F
croît
!
C’est un
algorithme
!
Commande Gretl
LOGIT
et
PROBIT
,même maniement que
OLS
Propriétés de MV
!
Si les hypothèses du MRL sont satisfaites sauf pour la contin
uité
de
Y
!
Si la fonction de distribution est correctement choisie
!
Hypothèse pas nécessairement critique (pseudo-maximumde
vraisemblance)
!
Généralement impossible à vérifier)
!
Alors l’estimateur MV est consistent et asymptotiquement
efficient
!
Mais généralement biaisé
!
Dans la pratique,la seule différence substantielle entre L
ogit et
Probit c’est que Logit est plus facile à calculer
!
Les coefficients sont différents mais pas les pentes
Exemple Gretl
!
Greene 19_1:un certain programme d’enseignement de
l’économie (PSI) est évalué par l’augmentation ou non des no
tes
des étudiants
!
Grade = 1 si la note a augmenté,= 0 sinon
!
GPA:Grade Point Average
!
TUCE:score sur un test de connaissance de cette matière
!
PSI = 1 si l’étudiant a reçu le programme spécial PSI
!
Dans les sorties Gretl
!
Tableau prédiction
!
Pseudo-
R
2
de McFadden
=
1
!
ln
L
ln
L
0

L
0
est la vraisemblance
du modèle sans variable explicative (seulement une constan
te)
!
Si les variables introduites n’expliquent rien,
L
0
=
L
et
Pseudo-
R
2
=
0
!
Si le modèle explique parfaitement
L
=
1
et Pseudo-
R
2
=
1
!
Entre les 2,on interprête comme le
R
2
du modèle linéaire
!
Pas de différence importante entre logit &probit
6.2 Choix multinomial
!
Lorsque la variable endogène présente
p
catégories
non-ordonnées,on se trouve dans un cas
multinomial
!
Par extension du cas dichotomique,on va vouloir estimer la
probabilité
de choisir une parmi ces
p
!
Plusieurs modèles sont possibles,on ne verra que le plus sim
ple:
logit multinomial
!
Pr
{
Y
i
=
k
|
x
i
}
=
exp
(
x
i
!
k
)
p
#
j
=
0
exp
(
x
i
!
j
)
!
Les coefficients sont différents par alternative
j
!
!
Lorsque
p
!
1
catégories n’ont pas été sélectionnées,la catégorie
p
sera forcément choisie
!
cfr.
p
=
2
:dichotomique
!
On doit donc normaliser,on va prendre habituellement qu’un
e des
catégories est la référence
!
Ses coefficients sont alors 0
Choix multinomial
!
Catégorie référence 0:
Pr
{
Y
i
=
0
|
x
i
}
=
1
1
+
p
#
j
=
1
exp
(
x
i
!
j
)
!
Les autres catégories
k
:
Pr
{
Y
i
=
k
|
x
i
}
=
exp
(
x
i
!
k
)
1
+
p
#
j
=
1
exp
(
x
i
!
j
)
!
Interprétation
!
Tous les résultats s’interprête relativement à la catégori
e de
référence
!
Un coefficient positif de
x
m
pour la catégorie
k
indique un effet
positif de
x
m
sur la probabilité de sélection de
k
par rapport à la
catégorie 0
!
La somme des probabilités doit faire 1,donc avec 3 catégorie
s 0,1,
2 si
x
m
a un signe positif pour les catégories 1 et 2,alors un
accroissement de
x
m
implique une baisse de la probabilité de
choisir la catégorie 0
!
Il faut calculer les effets marginaux,de façon similaire au
x
modèles dichotomiques
Exemple dans Gretl
!
Kean &Wolpin [keane dans Gretl]
!
Choix de carrière (0 = étude;1 = ni étude ni travail;2 = travai
l)
!
Variables explicatives:education,experience du travail
(linéaire
et carré),dichotomique “noir”
!
Échantillon d’homme,originellement sur un panel,on ne pre
nd
que 1987
!
Menu modèles non-linéaires logit multinomial