F. Varetto

2

LOGIT STATICO

Un breve cenno metodologico è sufficiente per richiamare il ben noto modello logit,
metodologia di uso comune quando la realizzazione di eventi prevede solo la risposta binaria
(0/1). La trasformata logit consente di ricondurre all’intervallo compreso tra 0 ed 1 il risultato di
un modello lineare, che per costruzione può estendersi a qualunque valore, tramite il passaggio al
𝑃𝑃
logaritmo degli odds delle probabilità del verificarsi degli eventi, ovvero 𝐿𝐿𝐿𝐿 � � = 𝛼𝛼 + 𝜷𝜷𝜷𝜷, in
1−𝑃𝑃
cui il membro di destra della relazione è la risposta lineare del modello. Si passa quindi
dall’insieme composto dalla retta reale ad una nuova mappa limitata tra zero ed uno. La
regressione logistica stima quindi la probabilità del verificarsi di un evento in base alla funzione
1
di distribuzione cumulativa logistica 𝑃𝑃 = 𝐹𝐹(𝛼𝛼 + 𝜷𝜷𝜷𝜷) =
, ove F(.) rappresenta la
1+exp (𝛼𝛼+𝜷𝜷𝜷𝜷)

distribuzione cumulata logistica, X è la matrice delle variabili esplicative ed α e β sono la costante
ed i coefficienti del modello. Ciascun soggetto contribuisce con una osservazione. La stima del
modello logistico è effettuata con la massima verosimiglianza, la cui funzione è data da
𝐿𝐿(𝛽𝛽|𝑑𝑑, 𝑥𝑥) = ∏𝑑𝑑=1 𝐹𝐹(𝛼𝛼 + 𝜷𝜷𝜷𝜷) ∏𝑑𝑑=0[1 − 𝐹𝐹(𝛼𝛼 + 𝜷𝜷𝜷𝜷)], in cui d (0;1) rappresenta una variabile
indicatrice che assume valore 1 se si verificato l’evento per il soggetto i-esimo e valore 0 in caso
contrario. Linearizzando la funzione di verosimiglianza con il passaggio ai logaritmi si ha
𝐿𝐿𝐿𝐿[𝐿𝐿(𝛽𝛽|𝑑𝑑, 𝑥𝑥𝑖𝑖 )] = ∑𝑛𝑛𝑖𝑖=1{𝑑𝑑𝑖𝑖 𝐿𝐿𝐿𝐿[𝑃𝑃(𝑥𝑥𝑖𝑖 )] + (1 − 𝑑𝑑𝑖𝑖 )𝐿𝐿𝐿𝐿[1 − 𝑃𝑃(𝑥𝑥𝑖𝑖 )]}.
Il modello è statico nel senso che non si tiene conto dell’intera storia precedente al verificarsi
dell’evento, salvo le informazioni riferite al periodo T-1 (o T-2, …, a seconda della specificazione
del lag temporale rispetto all’evento).
Tipicamente il mix campionario può essere costruito con diverse concezioni: una tipica
riguarda il completo accoppiamento di soggetti con evento e soggetti senza evento, scegliendo
questi ultimi su base casuale, ma badando ad accoppiare alcune caratteristiche ritenute rilevanti,
come appartenenza settoriale, dimensione, forma giuridica, area geografica, anno di bilancio (e
così via) per lo studio delle insolvenze aziendali; un’altra possibilità consiste nella selezione
casuale dei soggetti senza evento in modo tale che il mix campionario riproduca il mix di
universo; un’ulteriore scelta riguarda la selezione dei soggetti senza evento in un certo rapporto
n/1 con i soggetti con evento, in modo che il multiplo usato generi il mix desiderato ex-ante (ad
esempio 20 società sane per ciascuna società anomala).
3

SURVIVAL ANALYSIS IN TEMPO CONTINUO 4

L’analisi dell’evoluzione storica degli eventi si basa implicitamente sull’idea che il tempo sia
una variabile osservabile nel continuo che assume solo valori non negativi. Inoltre con riferimento
ad uno stesso soggetto spesso si possono verificare eventi multipli in momenti differenti. L’analisi
di sopravvivenza non si focalizza tanto sulla probabilità non condizionale del verificarsi di un
evento, quanto piuttosto sulla sua effettiva realizzazione e sul suo effettivo timing.
Nei modelli in tempo continuo si ha un insieme di N soggetti (imprese nel nostro caso)
indipendenti (i=1, 2, …, N) la cui osservazione inizia al tempo t=0 e prosegue fino all’istante ti
nel quale si verifica l’evento, oppure in cui l’osservazione viene censorizzata. La censorizzazione
significa che il soggetto non viene più osservato oltre il tempo ti o perché lo studio ha termine,
oppure perché per qualche ragione oltre quel momento non si dispone di ulteriori informazioni.
Il grafico seguente illustra i casi più importanti, rilevanti per questa ricerca5:

4

La letteratura sulla survival analysis è sterminata: per tutti si rimanda a Hosmer-Lemeshow-May (2008), Lee-Wang
(2003) e Klein-Moeschberger (2003); una sintesi dedicata ad applicazioni in campo economico è contenuta in Kiefer
(1988).
5
Per una illustrazione dei diversi tipi di censorizzazione e troncamento delle osservazioni si rinvia alla letteratura citata
nella nota precedente.

4