Comments
Description
Transcript
SAS/BASE - My LIUC
Esercizi Analisi Fattoriale + Regressione lineare Regressione logistica Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°13 Consegna Lavoro di gruppo • Scadenze per la consegna del lavoro di gruppo: I scadenza: Lunedì 12 Gennaio 2015 entro ore 12:00 II scadenza: Venerdì 23 Gennaio 2015 entro ore 12:00 • Fare riferimento alla signora Luezza (Segreteria, quarto piano) • Il materiale da consegnare consiste in: – – • stampa cartacea della presentazione in Power Point; un CD/chiavetta USB contenente questionario, base dati in formato Excel, programma SAS, output, presentazione Power Point. NOTA BENE: se il lavoro di gruppo non viene consegnato entro la data della prima scadenza, non è possibile sostenere l’esame al primo appello Esercizio 1: Analisi Fattoriale + Regressione Lineare Il dataset auto contiene 15 variabili e 35.108 allestimenti auto. Di seguito la descrizione di ogni variabile: # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Variable anzianita_modello aspetto_esterno cilindrata dati_tecnici impronta larghex lunghex n_model_restyling numcilindri numposti passo percorrenzamedia porte potenza Quotazione Descrizione Anzianità del modello espressa in mesi Inidica se ci sono state modifiche all'aspetto esterno del modello Cilindrata Inidica se ci sono state modifiche ai dati tecnici del modello Lunghezza * Larghezza Larghezza in metri Lungezza in metri Numero di volte in cui c'è stato un restyling Numero di cilindri Numero di posti Distanza tra l'asse anteriore e quello posteriore in metri Percorrenza media in km Numero di porte Potenza Quotazione Esercizio 1: Analisi Fattoriale + Regressione Lineare 1. Allocare una libreria che punti alla cartella in cui si è salvato il dataset. 2. Accertarsi che le opzioni per l’output HTML siano correttamente impostate 3. Effettuare un’analisi fattoriale utilizzando le seguenti variabili: ANZIANITA_MODELLO ASPETTO_ESTERNO CILINDRATA DATI_TECNICI IMPRONTA LARGHEX LUNGHEX N_MODEL_RESTYLING NUMCILINDRI NUMPOSTI PASSO PERCORRENZAMEDIA PORTE POTENZA Scegliere il numero di fattori, interpretarli, salvarli in un dataset. Esercizio 1: Analisi Fattoriale + Regressione Lineare 4. Effettuare una regressione lineare utilizzando come variabile dipendente la variabile Quotazione e come potenziali regressori i fattori ottenuti al punto precedente • • • • • Esistono problemi di influenza e / o di multicollinearità? E’ un modello soddisfacente? Quali fattori risultano essere significativi? Qual è il regressore più importante? Come si può interpretare il modello? Esercizio 2: Regressione Logistica Il dataset ct_pp_propensity contiene 23 variabili e 145.401 clienti di una banca. Di seguito la descrizione di ogni variabile: # 1 2 3 4 5 6 7 8 9 10 11 12 13 15 16 17 18 19 20 21 23 Variable ID CLIENTE ACQUISTO_PP FLG_REF_CC FLG_DOMICILIAZIONE_UTENZE FLG_POSSESSO_DEBITO FLG_ACCREDITO_PENSIONE FLG_POSSESSO_BT FLG_RID_12M FLG_CONTO_CORRENTE FLG_POSSESSO_CREDITO ETA N_COINT_POSS_CC N_NDG_TOTALI CAR_NUM_PREL AFI_IMP_TOT_M6 CS_NUM_CS MAR_PCT_IMP_FINNZ_IMPGH_BT_M6 OPR_IMP_PREL_TOT_M6 OPR_IMP_SPE_CAR_D_TOT_M6 OPR_IMP_USC_TOT_M6 OPR_PCT_IMP_USC_INT_M6 Descrizione Variabili Codice identificativo cliente Acquisto un prestito personale nel periodo considerato Referente di del conto corrente analizzato Domiciliazione utenze Possesso di Carte di Debito Accredito dello stipendio e/o della pensione Possesso di Crediti BT base Attivazione di un RID verso un concorrente negli ultimi 12 mesi Possesso di c/c Possesso Carte di Credito Età in classi Numero di cointestari del Conto Corrente Numero di contratti attivi per il cliente Numero di prelevementi con carta di credito Afi (Attività Fruttifere d'Interessi) medio degli ultimi 6 mesi Numero di classi di famiglie di prodotti Percentuale media Margini Finanziari Impieghi BT sul totale margini nell'ultimo semestre Importo medio prelevato nell'ultimo semestre Importo medio speso mediante l'utilizzo del bancomat nell'ultimo semestre Importo medio delle uscite nell'ultimo semestre Percentuale delle uscite sul canale internet Esercizio 2: Regressione Logistica Effettuare una regressione logistica utilizzando come variabile dipendente la variabile ‘ACQUISTO_PP’ e come potenziali regressori le seguenti variabili: FLG_DOMICILIAZIONE_UTENZE FLG_POSSESSO_DEBITO FLG_ACCREDITO_PENSIONE FLG_POSSESSO_BT FLG_RID_12M FLG_CONTO_CORRENTE MAR_PCT_IMP_FINNZ_IMPGH_BT_M6 FLG_POSSESSO_CREDITO N_COINT_POSS_CC N_NDG_TOTALI CAR_NUM_PREL AFI_IMP_TOT_M6 OPR_IMP_PREL_TOT_M6 OPR_IMP_USC_TOT_M6 OPR_PCT_IMP_USC_INT_M6 OPR_IMP_SPE_CAR_D_TOT_M6 Esercizio 2: Regressione Logistica • Qual è la percentuale di clienti che ha acquistato un Prestito Personale? • Verificare la bontà del modello stimato • Esiste un problema di multicollinearità? • Quali regressori risultano significativi? • Quali regressori hanno un impatto positivo e negativo sulla variabile risposta? • Quale regressore è più importante nella spiegazione della variabile risposta?