-
Notifications
You must be signed in to change notification settings - Fork 0
/
6. Estadistica inferencial no parametrica
159 lines (109 loc) · 4.06 KB
/
6. Estadistica inferencial no parametrica
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
////////////////////////////////////////////////// ///////////////////////////////
// PROYECTO: ESTADISTICA INFERENCIAL NO PARAMETRICA
// AUTOR: ADRIAN ALEJANDRO DELGADO RIVERO
// BASE DE DATOS: -
// FUENTE: -
// VARIABLES: -
// CONTACTO: [email protected]
// CONTACTO: +591 69539797
// PAIS: Bolivia
////////////////////////////////////////////////// ///////////////////////////////
*1. PREVIO
* Memoria
set mem 300m // Aumenta la memoria del sistema a 300 megas
* Directorio
cd "C:\Users\Usuario\Documents\Bases de datos\EJEMPLO"
* Archivo de registro
* log using name.log, replace
* log close // off on
*2. DATOS.
*2.1. IMPORTAMOS BASES DE DATOS
import spss "C:\Users\Usuario\Documents\Bases de datos\EH-SPSS\EH 2022\EH2022_Persona", clear // abrimos la EH_2022, seccion
*3. TRATAMIENTO DE DATOS
*3.1. MANTENER VARIABLES
{
keep folio /// id
area ///
aestudio /// escolaridad
s01a_03 /// edad
cobersalud /// tiene seguro medico
s04f_35 /// afiliado a AFP
depto /// departamento
ylab /// ingresos laboral
ynolab /// ingreso no laboral
s01a_02 /// Sexo
phrs /// hrs laborales semana
factor
}
*3.2 RENOMBRAR
{
rename (aestudio s01a_03 s01a_02 phrs) ///
(escolaridad edad sexo hrs_sem)
}
*3.3. GENERAR VARIABLES
{
generate exper = ((edad-6)-escolaridad) // ejemplo para experiencia
replace expe=0 if edad<0 // remplazamos experiencia nula si no tienen edad
label variable expe "Experiencia laboral en años" //colocamos etiquetas
generate mujer= sexo ==2
generate empleado =1 if ylab!=0 // creamos la variable "empleado" si
replace empleado=0 if ylab ==0
replace empleado=. if ylab==.
generate seg= cobersalud==1 // ejemplo para una dicotomica
replace seg=0 if cobersalud==2 // remplazamos para valores del caso
replace seg=. if cobersalud==. // remplazamos para valores faltante
generate AFP= s04f_35 ==1 // ejemplo para una dicotomica
replace AFP=0 if s04f_35 ==2
replace AFP=. if s04f_35 ==.
generate informalidad =1 if AFP==0 | seg==0 // ejemplo para una variable con condicion logica
replace informalidad =0 if AFP==1 | seg==1
gen ytotal = ylab + ynolab // Ingreso total
gen p_ylab = ylab/ytotal // proporcion del ingreso laboral
gen p_ynolab = ynolab/ytotal // proporcion del ingreso no laboral
gen p_ytotal = ytotal/ytotal // proporcion del ingreso no laboral
}
*4. ESTADISTICA INFERENCIAL NO PARAMETRICA
* 4.1. MEDIANA
{
*Ho:Las muestras tienen la misma mediana.
median ylab, by(area)
*Ho: Las distribuciones de las dos muestras son iguales (incluyendo las medianas).¨
ranksum ylab, by(area) //2 grupos
*Ho:La mediana de las diferencias es cero.
signrank var1 = var2
}
*4.2 VARIANZA
{
*Ho:Las distribuciones (medianas) de los grupos son iguales.
kwallis ylab, by(depto) //>2 grupos | Equivale al ANOVA
}
*4.3. NORMALIDAD
{
sktest ylab // si es menor a 0.05 entonces no sigue una distribucion normal
sktest ylab if informalidad==1
sktest ylab if informalidad==0
swilk ylab
bysort peso: swilk price
histogram price, by(peso) normal
kdensity price, normal
ksmirnov price, by(peso)
by caeb_op, sort :mvtest normality yprilab /// MULTIVARIADA
*4.4. CORRELACION
spearman edad ynolab escolaridad ylab, stats(rho) star(0.05) pw matrix
ktau edad ynolab escolaridad ylab, stats(taua taub) star(0.05) pw matrix
}
*4.5. CHI 2
{
tab A B, chi2
}
*4.6. DISTRIBUACION
*Prueba de Kolmogorov-Smirnov de una muestra
*Compara la distribución empírica de una muestra con una distribución teórica específica (por ejemplo, normal, uniforme, exponencial).
*Ho: La muestra proviene de la distribución teórica especificada.
ksmirnov escolaridad = normal(escolaridad)
*Prueba de Kolmogorov-Smirnov de dos muestras:
*Compara las distribuciones empíricas de dos muestras independientes para determinar si provienen de la misma distribución.
*Ho:Las dos muestras provienen de la misma distribución.
*P<0.05 Las distribuciones son diferentes
ksmirnov escolaridad, by(area)
}