Sistema Integrado de Registros Estadísticos y Encuestas

¿Qué es el SIREE?

El SIREE es un sistema, en la acepción más amplia del término, formado por un conjunto de elementos relacionados entre sí que funciona como un todo. Es, por un lado, un sistema conceptual (conceptos, definiciones, metadatos, metodología), un sistema de gestión (procesos, administración) y un sistema de información estadística (Data Warehouse Estadístico), por otro. El SIREE se basa en tres pilares fundamentales: personas, procesos y tecnología, alineados con la estrategia del INE.

Componentes del sistema

El sistema integrado de registros estadísticos está conformado por una serie de registros estadísticos: registros base, registros primarios y registros integrados.
Los registros base tienen como función definir los objetos y poblaciones del sistema de registros. Son la columna vertebral del sistema pues contienen los tipos de objetos y los vínculos más relevantes. La calidad del sistema está determinada por las definiciones de los objetos y la cobertura de los registros base.

Registro base de población: es el registro de todas las personas nacidas o que residen permanentemente o temporalmente en el país (adaptado de CAN ).
Registro base de inmuebles: es el registro de los predios urbanos y rurales del país, así como de las construcciones o edificaciones y viviendas construidas dentro de ellos.
Registro base de empresas: es el registro de todas las entidades comerciales y no comerciales, públicas y privadas, constituidas en el país. 

Proceso de transformación de registros administrativos en registros estadísticos

El registro administrativo, como en general no ha sido concebido para fines estadísticos, debe transformarse en un registro estadístico. Esto implica controles de consistencia y calidad, depuración de datos, estandarización de variables, creación de variables agregadas/derivadas, creación de objetos o unidades derivadas, unión de registros, documentación de metadatos y el aseguramiento de la calidad durante todo el proceso.

GSRBPM – Modelo Genérico de Procesos de Producción de Registros Estadísticos (adaptado de GSBPM - UNECE)

Se ha hecho una adaptación del modelo GSBPM de UNECE y se ha creado el Modelo Genérico de Procesos de Producción de Registros Estadísticos (GSRBPM – Generic Statistical Registers Business Process Model).

Diseño conceptual del Data Warehouse Estadístico

El objetivo principal de un Data Warehouse (DW) en el ámbito empresarial es integrar y almacenar los datos generados como resultado de las actividades de una organización.
En los INE, el DW se ha usado generalmente como un sistema de salida, recopilando datos agregados finales; pues los procesos de producción estadística de diferentes temas se realizan de forma independiente, como silos.
El enfoque moderno de producción estadística basada en un Data Warehouse exige que los datos agregados sobre diversos temas se produzcan como partes integradas de un sistema de información completo, en lugar de hacerlo de forma independiente entre sí. Los datos en un dominio estadístico común se almacenan una vez para múltiples propósitos.

- "es un almacén central de datos estadísticos para gestionar todos los datos de interés disponibles, que permite al INE (re)utilizarlos para crear nuevos datos/resultados, producir la información necesaria y realizar informes y análisis, independientemente de la fuente de los datos”.
- “almacén central o concentrador de datos estadísticos, independientemente de la fuente”.

El DW está diseñado para proveer una visión integral y en múltiples dimensiones de los datos provenientes de diferentes fuentes, rompiendo así con los silos de información compartimentada.
Además, el DW se convierte en la parte central de toda la infraestructura de tecnología de la información que soporta la producción estadística del INE. Es capaz de gestionar tanto microdatos como datos agregados y sus metadatos de diferentes fases del proceso de producción estadística.  

Arquitectura del Data Warehouse Geo-Estadístico

La arquitectura del DW está basada en cuatro capas que estructuran los componentes en cuanto a las tecnologías de la información, pero también desde el punto de vista de la gestión de procesos.

1. Capa de entrada de datos.

2. Capa de Transformación e integración de datos. 

3. Capa de Actualización y agregación centralizada de datos.

4. Capa de Análisis y presentación de datos.