El siguiente documento fue elaborado por:

Rebeca Riella - División Normalización, Investigación y Proyectos

Abril 2022

1. Introducción



El diseño muestral de la Encuesta Anual de Actividad Económica (EAAE) es aleatorio, por conglomerados y estratificado. Las empresas son estratificadas en base a su tamaño (personal ocupado y/o ventas) y a su clase de actividad económica principal. Las empresas grandes son incluidas a priori de forma forzosa en la muestra, mientras que las empresas pequeñas y medianas son seleccionadas al azar.

La EAAE es una encuesta de tipo panel rotativo más nacimientos. El panel rotativo implica que las empresas aleatorias (pequeñas y medianas) permanezcan un mínimo de tres años en la muestra, para luego ser sustituidas por otras empresas del mismo estrato de diseño. Este diseño permite obtener estimaciones confiables, de un período a otro, tanto de los niveles de los distintos indicadores como de sus variaciones.

El marco muestral de la EAAE para el año 2020 está compuesto por aproximadamente 11.800 empresas. El tamaño de la muestra teórica se definió en 3.990 empresas y la muestra efectiva obtenida fue de 2.583 empresas, lo que se traduce en una tasa de efectividad del 64,7%.


2. Condición de elegibilidad



Son elegibles para participar en la EAAE las empresas que cumplan las siguientes características:

  1. La empresa tiene personal ocupado dependiente promedio en el año mayor o igual a 10 y/o presenta un promedio mensual de ventas mayor a 175.794.198 pesos.

  2. La actividad económica principal de la empresa siguiendo la clasificación CIIU REV 4 se encuentra comprendida en las secciones de actividad (SEC):

  • B. Explotación de minas y canteras
  • C. Industrias Manufactureras
  • D. Suministro de electricidad, gas, vapor y aire acondicionado
  • E. Suministro de agua; alcantarillado, gestión de desechos y actividades de saneamiento
  • G. Comercio al por mayor y al por menor; reparación de vehículos de motor y de las motocicletas
  • H. Transporte y almacenamiento
  • I. Alojamiento y servicio de comida
  • J. Información y comunicación
  • K. Actividades financieras y de seguros.
  • L. Actividades inmobiliarias
  • M. Actividades profesionales, científicas y técnicas
  • N. Actividades administrativas y servicios de apoyo
  • P. Enseñanza
  • Q. Servicios sociales y relacionados con la Salud Humana
  • R. Artes, entretenimiento y recreación
  • S. Otras actividades de servicios


3. Marco muestral



El marco muestral es de donde se selecciona la muestra. Se construye a partir del Directorio de Empresas y Establecimientos (DEE) que lleva adelante de forma anual y continua el INE. El DEE se conforma a partir de fuentes administrativas provenientes de la Dirección General de Impositiva (DGI) y del Banco de Previsión Social (BPS). Los registros son depurados en base a información del INE proveniente de sus propias encuestas y relevamientos específicos realizados para mejorar la calidad de la información.

Con la información disponible para el año 2019 se construyó el marco muestral para la EAAE 2020, compuesto por 11.776 empresas. En el Gráfico 1 se presenta la cantidad de empresas según su actividad económica principal a nivel de sección de actividad.


Gráfico 1: Cantidad de empresas en el marco muestral del año 2020 según sección de actividad económica

Fuente: Marco muestral EAAE 2020, INE


4. Diseño muestral



El diseño muestral es aleatorio, por conglomerados y estratificado. La unidad de muestreo es la empresa, la cual puede verse como un conglomerado o cluster de actividades económicas. Para la selección de la muestra, el universo de empresas es particionado en estratos y dentro de los mismos se realiza un sorteo independiente, aleatorio y sistemático con las empresas ordenadas en función del personal ocupado.


4.1. Estratificación



El interés principal de la EAAE es estimar el total de la producción, valor agregado, remuneraciones y el personal ocupado para la población de interés. Por este motivo la estrategia de selección tiene en cuenta en la información disponible en el marco muestral sobre cantidad de personal ocupado y monto de remuneraciones de las empresas.

Al mismo tiempo, la EAAE no solo intenta proporcionar estimaciones confiables para el total del universo sino que también a nivel de sub sectores de actividad (dominios), por lo cual los tamaños de muestra para los distintos sub sectores son controlados a priori para obtener estimaciones más precisas. La estratificación reconoce dos dimensiones: la clase de actividad económica principal de la empresa (agrupaciones de clases de actividad a cuatro dígitos, denominada CAE) y una medida de tamaño, que corresponde al personal ocupado registrado en BPS y/o a las ventas declaradas ante la DGI. Esto significa que cada CAE es estratificada en tres estratos de tamaño:

  • Estrato 1: comprende a las empresas con personal ocupado entre 10 y 19
  • Estrato 2: comprende a las empresas con personal ocupado entre 20 y 49
  • Estrato 3: comprende a las empresas con Personal ocupado mayor o igual a 50 y/o promedio mensual de ventas por un monto mayor a 175,8 millones de pesos.

El estrato de tamaño 3 es de inclusión forzosa a priori, es decir, todas las empresas dentro del estrato son encuestadas (censo).

En los gráficos 2 y 3 se puede apreciar la importancia del estrato forzoso en dos de las principales variables de interés: Personal Ocupado Dependiente (POD) y remuneraciones (REM) según los datos administrativos presentes en el marco muestral de la EAAE para el año 2020.


Gráfico 2. Participación del estrato forzoso en el empleo para cada sección de actividad económica en el marco muestral de la EAAE 2020

Fuente: Marco muestral EAAE 2020, INE


Gráfico 3. Participación del estrato forzoso en las remuneraciones para cada sección de actividad económica en el marco muestral de la EAAE 2020

Fuente: Marco muestral EAAE 2020, INE

Observación: el marco muestral no cuenta con información de remuneraciones para las empresas públicas pertenecientes a estratos forzosos. Esto implica que la participación del estrato forzoso en las remuneraciones se encuentre subrepresentado para secciones de actividad donde las empresas públicas tengan un peso relevante.


4.2. Tamaño de muestra



Los tamaños de muestra para los estratos forzosos vienen dados por la cantidad de empresas que se encuentran clasificados en los mismos. Los tamaños de muestra para cada uno de los estratos aleatorios son calculados utilizando como variable auxiliar las remuneraciones de la empresa según los registros del BPS. Se calculan de manera de obtener coeficientes de variación para los estimadores de los totales de las remuneraciones y personal ocupado por CAE de como máximo 5%.

Posteriormente, los tamaños de muestra definidos producto de la asignación óptima son ajustados de forma de tener un mínimo de cuatro empresas por estrato, así como una probabilidad de selección máxima de 1/25 para empresas medianas y de 1/15 para empresas pequeñas.

Bajo estos requerimientos el tamaño de muestra teórico se fijó en 3.903 empresas. En el siguiente cuadro se presenta la distribución del tamaño de muestra por sección de actividad y estrato de tamaño.


Cuadro 1: Tamaños de muestra teórica por estrato tamaño y según sección de actividad

Estrato
Sección de actividad Total 10 a 19 20 a 49 Forzoso
B. Explotación de minas y canteras 22 11 10 1
C. Industrias Manufactureras 765 240 218 307
D. Suministro de electricidad, gas, vapor y aire acondicionado 6 2 2 2
E. Suministro de agua; alcantarillado, gestión de desechos y actividades de saneamiento 31 7 8 16
G. Comercio al por mayor y al por menor; reparación de vehículos de motor y de las motocicletas 961 294 265 402
H. Transporte y almacenamiento 367 126 85 156
I. Alojamiento y servicio de comida 171 67 46 58
J. Información y comunicación 133 28 23 82
K. Actividades financieras y de seguros 95 38 23 34
L. Actividades inmobiliarias 77 18 39 20
M. Actividades profesionales, científicas y técnicas 194 66 65 63
N. Actividades administrativas y servicios de apoyo 329 51 47 231
P. Enseñanza 272 36 21 215
Q. Servicios sociales y relacionados con la Salud Humana 246 45 33 168
R. Artes, entretenimiento y recreación 87 16 12 59
S. Otras actividades de servicios 147 47 46 54
Total 3.903 1.092 943 1.868
Fuente: Muestra teórica EAAE 2020, INE


4.3. Selección de las empresas en la muestra



El panel rotativo implica que las empresas aleatorias (pequeñas y medianas) permanezcan un mínimo de tres años en la muestra, para luego ser sustituidas por otras empresas del mismo estrato.

En el año 2020, partiendo de la muestra del año anterior, se seleccionó 1/3 de las empresas de cada estrato aleatorio para ser remplazadas por empresas nuevas del mismo estrato. Las empresas a ser removidas de la muestra fueron seleccionadas aleatoriamente entre las que cumplieran tener más de 3 años en el panel, siempre que existiesen en el marco empresas nuevas para sustituirlas. El sorteo realizado fue sistemático con arranque aleatorio, con las empresas ordenadas por clase de actividad (CIIU REV.4 a cuatro dígitos) y por personal ocupado a los efectos de no distorsionar la representatividad a nivel de esas dos variables.

Además, se ajustó el número de empresas de cada estrato de acuerdo al tamaño de muestra óptimo calculado. Las empresas incluidas en la muestra, en cada uno de los estratos, fueron seleccionadas directamente bajo un diseño sistemático de arranque aleatorio donde las empresas se ordenan por clase de actividad y por personal ocupado. Para estratos donde debieron ser removidas empresas, se realizó un sorteo de iguales características al referido en el párrafo anterior.

Por su parte, las empresas incluidas en el marco muestral clasificadas en el estrato de tamaño 3 fueron todas incluidas en la muestra.


4.4. Actualización de marco y de la muestra teórica



En el transcurso del relevamiento se agregaron a la muestra teórica 87 nuevas empresas, alcanzando un número total de 3.990 empresas. Esto sucede cuando se dispone del Directorio de Empresas y Establecimientos (DEE) del año 2020 actualizado y se detectan nuevas empresas que, según los datos de personal ocupado y/o ventas del DEE 2020, pertenecen a estratos Forzosos de la EAAE y no formaban parte de la muestra teórica original.


Cuadro 2: Tamaño de muestra teórico original y final

Cantidad de empresas
Muestra teórica original 3.903
Altas según Directorio 2020 87
Muestra teórica actualizada 3.990
Fuente: Muestra teórica (actualizada) EAAE 2020, INE


5. Muestra efectiva



Culminado el relevamiento, la muestra efectiva se situó en 2.583 empresas. Esto se debe a la no respuesta, la no elegibilidad o la imposibilidad de contacto con las empresas que habían sido seleccionadas originalmente.

La no elegibilidad se debe a que la actividad económica principal de una empresa no se encuentra dentro de las actividades investigadas por la EAAE, existiendo un error o un cambio respecto a lo que figura en el marco muestral. A su vez, existen casos en la muestra para los que no es posible determinar si son elegibles o no. Dichos casos corresponden a empresas que no pudieron ser ubicadas y por ende es imposible establecer si son elegibles o no de participar en la EAAE.


Cuadro 3: Muestra teórica por causales

Cantidad de empresas
Elegibles que respondieron (ER) 2.583
Elegibles que no respondieron (ENR) 830
No Elegibles (NE) 372
Elegibilidad desconocida (ED) 205
Total (n) 3.990
Fuente: Muestra teórica (actualizada) EAAE 2020, INE


La tasa de efectividad (TEF) se situó en 64,7% y se define como:

\[ TEF=\frac{ER}{n} \times 100,\]

Por su parte, la tasa de elegibilidad (TE) se situó en 90,2% y se define como:

\[ TE=\frac{n-(ED+NE)}{n-ED} \times 100,\] Por último, la tasa de respuesta (TR) se situó en 75,7% y se define como:

\[ TR=\frac{ER}{ER + ENR} \times 100,\]

6. Ponderadores de la encuesta



Los datos de la muestra efectiva son ponderados, de forma de obtener estimaciones tanto a nivel del total de la población como para otros dominios de estudio. El ponderador final para la empresa \(i\) viene dado por:

\[w_{ih}=w_{ih}^0\times nr_{ih} \times g_{ih}, \]

donde \(w_{ih}^0\) es el ponderador original o basado en el diseño para la empresa \(i\) perteneciente al estrato \(h\), \(nr_{ih}\) es el ajuste por no respuesta y \(g_{ih}\) es el ajuste proveniente de la calibración.


6.1 Ponderador original



El ponderador muestral teórico depende de la estrategia utilizada para la selección de las empresas en la muestra, es decir, las probabilidades de inclusión de las empresas provenientes del diseño muestral.

El ponderador teórico de la empresa \(i\) perteneciente al estrato \(h\) es:

\[ w_{ih}^0=\frac{N_h}{n_h},\]

donde \(N_h\) y \(n_h\) son la cantidad de empresas en el marco y en la muestra teórica respectivamente perteneciente al estrato \(h\). Esto significa que cada empresa de la muestra teórica se representa a ella misma y a \(N_h/n_h -1\) empresas que pertenecen al universo y no pertenecen a la muestra de la EAAE.


6.2 Ajuste por no respuesta



La no respuesta y la imposibilidad de contactar a algunas de las empresas que fueron sorteadas en la muestra teórica obliga a ajustar los ponderadores originales. El ajuste fue realizado a nivel de estrato multiplicando el ponderador original \(w_{ih}\) por el inverso de la tasa de efectividad en el estrato. El ponderador muestral para la empresa \(i\) perteneciente al estrato \(h\) ajustado es

\[w_{ih}^{nr}= {w_{ih}^0} \times {nr_{ih}} = {w_{ih}^0} \times {{TEF_h}^{-1}} = \frac{N_h}{m_h},\]

donde \(TEF_h\) es la tasa de efectividad en el estrato \(h\) y \(m_h\) es el tamaño de muestra efectivo (elegibles respondentes) en el estrato de diseño \(h\) .

La tasa de efectividad presenta una asociación con el tamaño de la empresa (ver Cuadro 4). La no efectividad se debe principalmente a la deficiencia en el marco muestral en lo concerniente a las variables de identificación y ubicación de las unidades. También obedece a la volatilidad del ciclo de vida de las empresas que conforman el universo de estudio, factor que se intensifica en las empresas pequeñas en términos de su Personal Ocupado.


Cuadro 4: Tamaños de muestra teóricos y efectivos, y tasa de no respuesta por estrato de tamaño

Estrato Muestra teórica (MT) Muestra efectiva (ME) Tasa de no respuesta (TNR)
1 1091 469 57,0
2 925 568 38,6
3 1974 1546 21,7
Total 3990 2583 35,3
Fuente: Muestra teórica y efectiva EAAE 2020, INE


6.3 Calibración



La calibración/regresión es un método que consiste en ajustar (calibrar) los ponderadores originales utilizando información auxiliar acerca de la estructura del universo, con el objetivo que la muestra expandida coincida con la información conocida del Universo, lo cual brinda coherencia y comparabilidad a las estimaciones obtenidas. Por otra parte, si la información auxiliar utilizada se encuentra relacionada con las variables de interés de la encuesta, la precisión (reducción del error estándar) de las estimaciones mejora notoriamente. Finalmente, la calibración sirve para minimizar el sesgo ocasionado por la no respuesta siempre que la misma esté correlacionada con las variables utilizadas para la calibración.

La información auxiliar para la calibración de los ponderadores de la EAAE es el número de empleados, remuneraciones y las ventas registradas en el periodo de las empresas las cuales se encuentran contenidas en el propio marco muestral de donde se seleccionó la muestra de la EAAE. La calibración se lleva a cabo a nivel de sección de actividad, esto provoca que las estimaciones de la cantidad de empresas, el total de empleados, total de remuneraciones y el total de las ventas para cada una de las trece secciones de actividad que componen el universo de estudio de la EAAE coincida exactamente con el marco muestral.

Los ponderadores calibrados quedan definidos como:

\[w_{ih}^{re}=w_{ih}^{nr}\times g_{ih} ,\]

donde \(g_{ih}\) es el factor de ajuste proveniente de la calibración.

El ajuste proveniente de la calibración para la empresa \(i\) perteneciente al estrato \(h\) es definido como:

\[ g_{ih}=1 + (\mathbf{X}-\hat{\mathbf{X}})^{'} (\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}^{nr}\mathbf{x}_{ih}\mathbf{x}_{ih}^{'})^{-1}\mathbf{x}_{ih} , \]

donde \(s_{ER,h}\) es la muestra de las empresas elegibles respondentes en el estrato de diseño \(h\), \(\mathbf{x}_{ih}\) el vector de información auxiliar para la empresa \(i\) perteneciente al estrato \(h\) de dimensión \(J\), \(\mathbf{X}=\sum\nolimits_{h=1}^H \sum\nolimits_{i \in U_h}\mathbf{x}_{ih}\) es el vector de totales poblacionales de las variables auxiliares utilizadas para la calibración y \(\hat{\mathbf{X}}=\sum\nolimits_{h=1}^H \sum\nolimits_{i \in s_{ER,h}}w_{ih}^{nr}\times\mathbf{x}_{ih}\) es el estimador de \(\mathbf{t}_{\mathbf{x}}\) utilizando los ponderados provenientes del diseño muestral ajustados por la no respuesta.

En el siguiente gráfico se presentan los ajustes de los ponderadores originales provenientes de la calibración


Gráfico 4: Factores de ajuste producto de la calibración

Fuente: EAAE 2020, INE


Se impone como condición para la calibración que \(0.5<g_{ih}<2\). La restricción es impuesta como compromiso entre la reducción de posibles sesgos en las estimaciones, y un aumento innecesario en los errores estándar de las estimaciones por el hecho de un aumento en la variabilidad de los pesos.


6.4 Recorte o trimming de los pesos finales



Una vez computado los pesos ajustados por calibración pueden existir empresas muy grandes en términos de VAB o VBP que tengan ponderadores mayores a uno. En este caso, los ponderadores calibrados de dichas empresas son definidos a posteriori igual a uno debido a que las mismas se consideran únicas y por ende deberían representarse únicamente así mismas.


7. Precisión de las estimaciones



Las estimaciones varían entre muestra y muestra, es decir, dependiendo de la muestra que sea seleccionada son las estimaciones que se obtiene para los indicadores de interés de la encuesta. Esta variación producto del muestreo describe la incertidumbre de las inferencias acerca de la población en base a una muestra en particular y es medida por medio de la varianza del estimador. La varianza del estimador depende del diseño muestral, la variabilidad de los datos, el tamaño de muestra y el método de ajuste de los ponderadores determinan el error muestral.

El estimador para el total de la variable \(y\), \(Y=\sum\limits_{i=1}^Ny_{i}=\sum\limits_{h=1}^H\sum\limits_{i \in U_h} y_{ih}\), viene dado por:

\[\hat Y=\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}\times y_{ih},\]

donde \(y_{ih}\) es el valor que toma la variable \(y\) en la empresa \(i\) perteneciente al estrato de diseño \(h\).

La estimación de la varianza del estimador de un total bajo el diseño muestral de la EAAE y teniendo en cuenta la calibración de los ponderadores viene dada por:

\[\widehat {\text{Var}} (\hat Y)= \sum\limits_{h=1}^H N_h^2\times{(1-m_h\times N_h^{-1})}\times{m_h}^{-1}\sum\limits_{i \in s_{ER,h}}(e_{ih}-\bar e_h)^2\times (m_h-1)^{-1},\] donde \(e_{ih}=y_{ih}-\mathbf{x}_{ih}^{'}\hat{\mathbf{B}}\) es el residuo (error) de la empresa \(i\) perteneciente al estrato \(h\) con

\[\hat{\mathbf{B}}=(\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}^{nr}\mathbf{x}_{ih}\mathbf{x}_{ih}^{'})^{-1} (\sum\limits_{h=1}^H\sum\limits_{i \in s_{ER,h}}w_{ih}^{nr}\mathbf{x}_{ih}y_{ih})^{-1} , \] y \(\bar e_{ih}\) es la media muestral de los errores en el estrato de diseño \(h\).

Las estimaciones de las varianzas de los estimadores se llevaron a cabo en el paquete Survey del software libre R. A continuación se presentan los coeficientes de variación \[\widehat{\text{CV}}=\sqrt{\widehat{Var}(\hat Y)} \times {|\hat Y}^{-1}|\times 100\] expresados en porcentajes para las principales variables de interés VBP, VAB y remuneraciones (RA) a nivel de sección de actividad.


Cuadro 5: Coeficientes de Variación por sección de actividad

Coeficiente de variación (%)
Sección de actividad VBP VAB RA
B. Explotación de minas y canteras 13,32 8,47 6,60
C. Industrias Manufactureras 1,88 2,37 1,17
D. Suministro de electricidad, gas, vapor y aire acondicionado 0,00 0,00 0,00
E. Suministro de agua; alcantarillado, gestión de desechos y actividades de saneamiento 3,43 2,90 2,95
G. Comercio al por mayor y al por menor; reparación de vehículos de motor y de las motocicletas 3,16 2,92 2,02
H. Transporte y almacenamiento 13,71 4,13 3,67
I. Alojamiento y servicio de comida 19,03 7,17 4,38
J. Información y comunicación 4,68 3,14 2,27
K. Actividades financieras y de seguros 9,99 6,30 9,84
L. Actividades inmobiliarias 8,90 10,08 10,26
M. Actividades profesionales, científicas y técnicas 8,74 10,02 5,00
N. Actividades administrativas y servicios de apoyo 3,31 2,59 1,97
P. Enseñanza 8,06 5,37 3,82
Q. Servicios sociales y relacionados con la Salud Humana 2,32 1,60 1,41
R. Artes, entretenimiento y recreación 8,54 6,62 3,12
S. Otras actividades de servicios 20,99 11,28 8,48
Fuente: EAAE 2020, INE





Contacto: Depto. de Difusión y Comunicación

Instituto Nacional de Estadística

Torre Ejecutiva Anexo, Piso 4 Liniers 1280, C.P.: 11.100

Tel: (598) 29027303, ints.: 7723, 7725

E-mail: difusion@ine.gub.uy

Sitio Web: https://www.ine.gub.uy

Twitter: https://twitter.com/ine_uruguay