You are on page 1of 84

Departamento Administrativo Nacional de

Estadstica
DANE
Censo de poblacin y vivienda de Colombia
Ao 2005

Anlisis de la estructura y composicin de


las principales variables demogrficas y
socioeconmicas del Censo 2005

Informe final

Grupo Mixto nro. 2.2


Integrantes:
Edgar Baldin Waldron
Lina Marcela Salamanca
Clara Ins Gonzlez

Bogot, D.C.
30 de septiembre de 2008

CONTENIDO
Introduccin ..........................................................................................................................3
1. Marco general...................................................................................................................4
1.1 Objetivos.........................................................................................................................4
1.2 Metodologa ....................................................................................................................4
1.3 Procesos de depuracin .................................................................................................5
1.4 Proceso de anlisis.........................................................................................................5
1.4.1 Determinacin de la lnea de base ..............................................................................5
1.4.2 Utilidad del anlisis bsico...........................................................................................6
1.4.3 Definicin de los rangos de aceptacin o rechazo (tolerancias): ................................6
1.4.4 Integridad global ..........................................................................................................6
1.4.5 Coherencia con informacin de otras fuentes .............................................................7
2. Resultados........................................................................................................................7
2.1 Variables demogrficas ..................................................................................................7
2.1.1 Distribucin espacial....................................................................................................7
2.1.2 Edad ..........................................................................................................................14
2.1.3 Sexo...........................................................................................................................20
2.1.4 Parentesco.................................................................................................................27
2.1.5 Estado conyugal ........................................................................................................28
2.1.6 Pertenencia tnica .....................................................................................................29
2.1.7 Fecundidad ................................................................................................................30
2.1.8 Mortalidad ..................................................................................................................37
2.1.9 Migracin ...................................................................................................................39
2.2 Variables socioeconmicas ..........................................................................................43
2.2.1 Educacin ..................................................................................................................43
2.2.2 Actividad en la semana previa al Censo....................................................................55
2.2.3 Rama de actividad econmica...................................................................................57
2.3 Variables de la vivienda y el hogar ...............................................................................58
2.3.1 Variables de la vivienda.............................................................................................58
2.3.2 Variables del hogar....................................................................................................60
Resumen ............................................................................................................................61
Conclusiones y recomendaciones ......................................................................................66
Anexos................................................................................................................................69
Anexo A. Metodologa para determinar los niveles de subregistro de los nacimientos de
las mujeres censadas en 2006 ...........................................................................................69
Anexo B. Respuesta institucional al problema detectado en las variables educativas y en
las relacionadas con la actividad de las personas en la semana anterior al Censo 2005..77

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

INTRODUCCIN
Una de las recomendaciones de la Comisin Internacional de Evaluacin fue la creacin
por parte del DANE de varios grupos mixtos (con representacin interna y externa) con el
objetivo de estudiar a fondo temas derivados del Censo para los cuales subsisten dudas y
con el objetivo adicional de contribuir a la documentacin final del Censo.
La conformacin de los grupos mixtos de trabajo toma como punto de referencia las 7 reas
temticas recomendadas por la Misin y la seleccin preliminar de 4 reas grandes de
trabajo, que recogen los aspectos centrales del censo: (1) anlisis de los procesos previos
al procesamiento de la informacin; (2) procesamiento de la informacin e impacto sobre los
resultados; (3) anlisis de la cobertura censal; y (4) informacin recolectada sobre las
unidades econmicas independientes y la actividad agropecuaria asociada a la vivienda.
Como complemento e insumo para precisar el alcance de los grupos de trabajo, se tom
el inventario de los eventuales puntos crticos en cada uno de los componentes de los
procesos centrales del censo.
Con base en los fundamentos presentados se configuraron 5 grupos de trabajo:
1. Anlisis de los procesos previos al procesamiento de la informacin
2. El procesamiento de la informacin e impacto sobre los resultados, que dada la especificidad de los temas que encierra, dio lugar a la conformacin de dos grupos de trabajo:
a. Tecnologa de la informacin
b. Anlisis de la integridad y calidad de la informacin
3. Anlisis de la cobertura censal
4. Informacin recolectada sobre las unidades econmicas independientes y la actividad
agropecuaria asociada a la vivienda.
En este documento, se abordan temas correspondientes a la segunda parte de los
alcances especificados para el grupo 2: anlisis de la integridad y calidad de la
informacin. En sntesis, se analizan los aspectos relacionados con la depuracin de la
informacin, una vez que ha sido trascrita de los DMC e integrada a bases de datos
objeto de procesos de limpieza de algunos datos incoherentes o sobre los cuales no se
obtuvo respuesta. Estos procesos de depuracin estn orientados a mejorar la calidad de
la informacin obtenida durante el recuento; no obstante, de no ser utilizados correctamente, pueden causar un efecto negativo en la calidad de los resultados definitivos del
censo y que por tanto, ameritara rehacer algunos de los ejercicios implementados.
En este contexto, se analizan y valoran los cambios experimentados por los datos bsicos,
como producto del tratamiento de la informacin censal; se mira la correspondencia de los
resultados censales con los obtenidos mediante otras fuentes, y se sugieren algunas medidas orientadas a evitar que los errores detectados se vuelvan a producir en futuros censos.
El grupo de trabajo agradece el apoyo brindado por el personal de la Direccin de Censos y
Demografa, pero en particular, el soporte tcnico y colaboracin de los doctores dgar
Sardi, Guillermo Hernndez y Ral Prez.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

1. MARCO GENERAL
Cuatro principios orientan el anlisis:
1. En todos los censos existen errores de cobertura y de contenido: los primeros cuando
hogares y personas no quedan incorporados en el censo; y los segundos, cuando el
encuestador o el declarante cometen errores al anotar o proporcionar los datos sobre
caractersticas individuales o de los hogares.
2. La correccin de los datos incoherentes (consistencia interna) y la adicin de datos
que no existen en el cuestionarios, pero que admiten que se formulen supuestos
razonables al respecto (imputacin), son prctica comn en los censos.
3. Los procesos de depuracin (consistencia interna, imputacin, otros) no deben alterar
la distribucin espacial de la poblacin y tener efectos muy poco significativos o
inexistentes sobre la estructura y composicin de la poblacin.
4. La integralidad de la informacin tiene que preservarse durante todas las fases del
procesamiento de la informacin.

1.1 Objetivos
-

Verificar que la integridad de la informacin permanece una vez que experimenta


procesos de depuracin durante el procesamiento.

Valorar el impacto que los procesos de depuracin tienen sobre los resultados del
Censo 2005.

Analizar la correspondencia entre las estructuras del Censo 2005 con las que se
obtienen a travs de otras fuentes.

Plantear recomendaciones para la utilizacin de las bases de datos.

Establecer lineamientos tiles para futuros censos.

1.2 Metodologa
En sntesis, la metodologa radica en analizar los cambios que experimenta la informacin
entre la base inicial (cruda) y la base resultado de todos los procesos de depuracin
(final)1. De encontrarse variaciones que ameriten profundizacin, se procede a analizar las
bases intermedias correspondientes a cada uno de los procesos de depuracin (control
de estructura 1 y 2, imputacin), con el fin de precisar la fuente de error.

Incluye nicamente los procesos normales de depuracin, control de estructuras e imputacin; no contempla
los ajustes realizados mediante la conciliacin censal.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

Con base en los resultados de otras fuentes de informacin (censos anteriores,


encuestas), analizar la coherencia de los resultados del Censo 2005 para cada una de las
variables seleccionadas.

1.3 Procesos de depuracin


Los procesos de depuracin que experimenta la informacin censal corresponden a:
Control de estructura 1: busca lograr la integridad de los datos para permitir la
renumeracin de las edificaciones y unidades censales y as garantizar la integridad del
registro y codificacin de los mismos. Tambin, permite suprimir los registros de datos
sobrantes y las duplicaciones y controlar las variables de rea de las unidades agropecuarias, la unicidad de los registros de LEA, la codificacin de las unidades econmicas
segn CIIU a 4 dgitos y la codificacin de los grupos tnicos.
Control de estructura 2: es complemento del control de estructura 1, que busca la
integridad de las diferentes unidades censales y la correccin de algunas variables
respuesta que hacen parte de la estructura, como el caso de las Unidades Censales UC
de vivienda o de hogar, o de las variables de parentesco, sexo, edad y estado civil, y
centrarse esencialmente en lo que corresponde a la edad vlida, la unicidad tanto del jefe
como de cnyuge y la edad vlida de este ltimo.
Imputacin: este proceso permite depurar los datos censales, para generar los resultados
bsicos del Censo, al validar la consistencia de las variables mediante procesos lgicos de
imputacin. Corresponde al proceso ms importante de la depuracin de la informacin, se
utiliza para resolver problemas de no respuesta missing, invlidas o inconsistentes,
identificadas en el proceso de edicin (identificacin de registros potencialmente errneos).

1.4 Proceso de anlisis


1.4.1 Determinacin de la lnea de base
Corresponde a un conjunto reducido de variables de las personas, las viviendas y el hogar,
investigadas en el Censo 2005 y a algunos indicadores seleccionados; a todos ellos se les
realiza el anlisis descrito en la metodologa. Su aplicacin toma como fundamento la base
de datos crudos, producto de la recoleccin de la informacin.
La seleccin de las variables que conforman la lnea de base responden a: (1) las variables
fundamentales del Censo 2005; (2) aquellas de inters producto de la revisin documental,
o de particular atraccin por parte de los investigadores; (3) las que surgen por recomendaciones de profesionales internos y externos al DANE; y (4) otras de inters por la magnitud
del proceso de depuracin que experimenta.
Lnea de base
Variables demogrficas:

Volumen y distribucin espacial

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

Edad
Sexo
Parentesco
Estado conyugal
Etnia
Fecundidad
Mortalidad
Migracin interna y al exterior.

Variables socioeconmicas:

Educativas: analfabetismo, asistencia escolar, nivel educativo y ltimo ao aprobado


Actividad y rama de actividad econmica.

Variables de la vivienda y el hogar:

Vivienda: tipo y tenencia de la vivienda y servicios pblicos bsicos


Hogar: tamao del hogar.

1.4.2 Utilidad del anlisis bsico

Analizar las caractersticas de la informacin cruda: valores vlidos, valores perdidos


Determinar las variables objeto de profundizacin
Focalizar geogrficamente la incidencia de las variaciones: clase, departamentos y
municipios, si se considera necesario
Orientar la definicin de indicadores.

1.4.3 Definicin de los rangos de aceptacin o rechazo (tolerancias):


Corresponde al establecimiento de los niveles de tolerancia aceptados para las variaciones
en cada una de las variables y sus categoras, que conforman la lnea de base. Se acept
como rango vlido un punto porcentual de diferencia.
1.4.4 Integridad global
La comparacin de los resultados de la lnea de base, calculados con la base cruda y los
que arroja la base final, permite determinar si la informacin de cada una de las variables
bajo anlisis, se encuentra en los niveles de tolerancia esperados; de ser as, la
valoracin de integridad es positiva; si los resultados del anlisis se encuentran por fuera
de los niveles de tolerancia, se acude a las bases intermedias (estructura 1, estructura 2,
imputacin), con el fin de establecer la fuente que genera la variacin.
Las variables de la lnea de base pueden experimentar cambios significativos debido a
que: (1) los procesos de depuracin diseados no son los adecuados; y (2) el software
elaborado no corresponde a las normas de depuracin planteadas. Cualquiera que sea el
caso, debe analizarse y valorarse el proceso realizado.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

La base construida con los resultados del proceso CSPRO de depuracin, permite
obtener las estadsticas del proceso realizado en estructura 2, edicin e imputacin. De
aqu pueden salir otros indicadores, considerando el nivel de imputacin de cada variable.
1.4.5 Coherencia con informacin de otras fuentes
Con la finalidad de realizar algunos alcances sobre la calidad de la informacin, se analiza
la coherencia entre las estructuras bsicas de variables o indicadores seleccionados con
las que suministran otras fuentes; para el efecto, se lleva a cabo:

Definicin de variables e indicadores con base en el anlisis documental y las recomendaciones de expertos.

De encontrarse diferencias, se plantean las probables fuentes que explican la variacin.

2. RESULTADOS
2.1 Variables demogrficas
2.1.1 Distribucin espacial
Distribucin de la poblacin por clase2: las diferencias por clase no deberan existir; sin
embargo, aunque los cambios en los volmenes totales son relativamente muy pequeos,
estas diferencias se presentan; su impacto sobre los resultados es desestimable, pero a
nivel municipal puede tener significado (cuadro 1).
Cuadro 1
Distribucin de la poblacin, por base, segn clase
2005
Base cruda
Base final
Clase
Frecuencia
Porcentaje
Frecuencia
Porcentaje
Total
41 174 853
100,0
41 174 853
100,0
Urbano
31 279 657
76,0
31 282 708
76,0
Centro poblado
2 302 581
5,6
2 297 386
5,6
Rural disperso
7 592 615
18,4
7 594 759
18,4

Diferencia
0
-3 051
5 195
-2 144

Fuente: DANE Censo General 2005

Clase corresponde a:
Cabecera municipal: es el rea geogrfica que est definida por un permetro urbano, cuyos lmites se
establecen por acuerdos del Concejo Municipal. Es donde se localiza la sede de la Alcalda municipal.
Centro poblado: se define como una concentracin de mnimo 20 viviendas contiguas, vecinas o adosadas
entre s. Dicha concentracin presenta caractersticas urbanas tales como la delimitacin de vas vehiculares y
peatonales.
Rural disperso: es el rea que se caracteriza por la disposicin dispersa de viviendas y explotaciones
agropecuarias. No cuenta con un trazado o nomenclatura de calles, carreteras, avenidas, y dems.
(DANE. Censo General 2005. Nivel nacional. Bogot. 2008. Pg. 446).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

73 municipios, el 7% del total en el pas, presentan en la base final poblacin total


diferente a la observada en la base cruda, lo cual se produjo porque algunas reas
geogrficas pertenecientes a una localidad, fueron inicialmente incluidas como pertenecientes a otra. As, las diferencias se compensan, 37 de ellas son positivas, mientras que
Cuadro 2
Municipios con diferencias entre la base cruda y la final
2005
Municipio
Total
Medelln
Sucre
Lorica
Pivijay
Guamal
La Cruz
Purac
Tarso
Calima
El Tambo
Bolvar
Qupama
Cotorra
Villa Nueva
El Guacamayo
Caramanta
Caldas
Silos
Jess Mara
Vista Hermosa
Caicedonia
Totor
Villeta
La Pintada
Coln
El Dovio
Sevilla
Chima
La Paz
Vijes
Santa Brbara
Landzuri
San
Jos
de
Miranda.
San Cayetano
Ituango
Montera
Chitag

Diferencia
18 293
3 799
2 862
1 919
1 769
1 006
909
765
763
604
447
423
410
395
243
226
225
210
181
181
179
164
160
111
97
63
48
27
26
14
14
13
12
9
6
5
5
3

Municipio
Itag
Sabanas San ngel
Cimitarra
San Pelayo
Vlez
San Sebastin
Moitos
La Plata
Venecia
El Pen
Yotoco
La Unin
Timbo
Beln
Otanche
Aguada
Valparaiso
Jordn
Simijaca
Zarzal
San Juan de Arama
Piedecuesta
Silvia
Pursima
La Belleza
Guavat
Bituima
La Unin
Florin
Fredonia
Guaca
Mlaga

Diferencia
-18 293
-3 799
-1 769
-1 281
-1 237
-1 088
-1 006
-944
-765
-763
-712
-618
-553
-447
-419
-410
-323
-301
-243
-206
-191
-179
-178
-160
-159
-149
-134
-111
-48
-31
-21
-19
-9

Paime
Peque
San Carlos
Carmen de Carupa
Vijes

-6
-5
-5
-4

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

36 presentan el signo contrario (cuadro 2). Por ejemplo, Medelln en la base cruda tena
3.799 personas ms de las que aparecen en la base final; mientras que Itag mostraba el
caso contrario. Sin embargo, la correspondencia no siempre es uno a uno, ni Sucre ni
Lorica tienen su contraparte exacta, lo que seguramente muestra es que los excedentes
en la base cruda correspondan a ms de un municipio.
El ejercicio de restitucin de las AG3 a su municipio de origen asegura que la poblacin
corregida sea la que le corresponde; para estos municipios, el impacto de la correccin es
positivo. Este proceso se realiz de acuerdo con la evaluacin de la base geogrfica
desarrollada por la Direccin de Geoestadstica DIG, el cual est completamente
documentado.
Los centros poblados: la DIG entreg al Censo 2005 la base homologada que contiene
todos los centros poblados incluidos en la cartografa; de igual forma, la DIG cuenta con la
Divipola del ao 2007 que incluye no slo los registros actualizados de la base
homologada, sino tambin aquellos que las autoridades municipales reportaron como
existentes en sus localidades.
El cruce de las anteriores bases con la respectiva informacin incorporada en el Censo
General 2005, da como resultado que 298 centros poblados estn en la Divipola y en la
base homologada, pero no aparecen en el Censo 2005 (cuadro 3). De esta cifra, deben
descontarse 102, que corresponden a municipios en donde, por distintas razones, no se
llev a cabo el censo en la zona rural (centro poblado y rural disperso) o su cobertura fue
muy baja.
Los 196 centros poblados restantes pueden no aparecer en el Censo 2005 por distintas
razones: (1) pueden haberse clasificado como clase 3, rural disperso ante la no existencia
de cartografa para dicho centro poblado; (2) aunque la actualizacin de la Divipola reduce
significativamente esta posibilidad, puede haberse dado que el crecimiento de los centros
urbanos haya absorbido e integrado a su casco algunos de ellos (la actualizacin de 2004
no fue sobre todos los 1 119 entes territoriales); (3) se convirtieron en municipios o pasaron
a formar parte de municipios recin conformados y (4) pueden no haber sido detectados en
el operativo de campo.
La mayor parte de los departamentos experimentan algn grado de no deteccin o no
identificacin de centros poblados. El mayor nmero de ellos se observan en el Valle del
Cauca, Antioquia, La Guajira y Arauca.
An si se considerara el caso extremo en que ninguno de los 196 centros poblados fue
detectado durante el operativo, el impacto sobre los resultados a nivel nacional o
departamental es prcticamente inexistente (el tamao promedio de los centro poblados a
nivel nacional es de 160 personas). No obstante, a nivel municipal, la cobertura en
algunos de ellos podra verse afectada.

rea Geogrfica (AG): corresponde a una manzana en las cabeceras municipales y en los centros poblados;
y a una seccin rural, en el rea rural dispersa.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

Cuadro 3
Centro poblados inexistentes en el Censo 2005,
pero s en la Divipola y en la base homologada
Centros
Departamento
poblados
Total
196
Antioquia
17
Bogot, D.C., D.C.
2
Bolvar
10
Boyac
5
Caldas
7
Caquet
7
Cauca
7
Cesar
4
Crdoba
6
Cundinamarca
8
Choc
4
Huila
9
La Guajira
17
Magdalena
8
Nario
8
Norte de Santander
3
Quindo
2
Risaralda
13
Sucre
4
Tolima
8
Valle del Cauca
27
Arauca
15
Casanare
1
Putumayo
1
Guaina
3
Fuente: DANE Censo General 2005

Las reas geogrficas (AG): la perfecta identificacin y localizacin de las reas


geogrficas en terreno es fundamental para la organizacin, ejecucin del operativo de
recoleccin de la informacin y el aseguramiento de la cobertura.
Para el Censo General 2005, la Direccin de Geoestadstica suministr una base con
401.130 registros (AG); de ellos, el 77% en la zona urbana, el 15% en centros poblados y
el restante 8% en el rural disperso. El cruce de esta base de AG con las existentes en el
Censo, informa que el 17% de ellas no pueden ser identificadas en la base censal, como
reas en las que existen viviendas y personas. A nivel de clase, el diferencial de las AG
inexistentes es del 12% en el urbano; el 24% en los centros poblados y el 47% en el rural
disperso. Estos resultados no implican que las reas no hayan sido cubiertas, en la
medida en que en las AG se contemplan, tambin, parques, zonas verdes y reas no
desarrolladas sin viviendas ni personas (cuadro 4).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

10

Cuadro 4
AG en la base DIG existentes en el Censo 2005, segn clase
Existen
No existen
Clase
Total
AG
Porcentaje
AG
Porcentaje
Total
Urbano
Centro poblado
Rural disperso

401 130
308 603
58 471
34 056

333 853
271 519
44 427
17 907

83,2
88,0
76,0
52,6

67 277
37 084
14 044
16 149

16,8
12,0
24,0
47,4

Fuente: DANE Censo General 2005

La simbologa que debe acompaar a cada AG (1: parque; 2: zona verdes; 3: parque vivienda; 4: zona verde y vivienda; 5: parque y zona verde; 6: parque, zona verde y vivienda;
7: propiedad horizontal; 8: rea sin desarrollo) permitira precisar en cul existen viviendas;
no obstante, esta simbologa existe nicamente para 10 554 de ellas, todas de la zona
urbana, pertenecientes a sectores de 113 municipios, lo cual limita su utilidad, primero, para
la explotacin adecuada de su potencial en el Censo 2005; y segundo, para que sirva de
referente vlido en la estimacin de la no cobertura censal (cuadro 5).
Se debe establecer un control adicional, 221 municipios fueron compensados4, 65 de ellos
en la zona urbana, y por tanto, las AG pertenecientes a esta zona no deben tomarse en
consideracin en el anlisis. No obstante, ninguno de los 65 aparece dentro de los 113
con informacin de la simbologa.
Cuadro 5
AG con simbologa, segn la existencia de viviendas
Concepto
Total
AG sin viviendas
AG con viviendas

Frecuencia

Porcentaje

10 554
5 562
4 992

100,0
52,7
47,3

Fuente: DANE Censo General 2005

Los estimativos realizados con las 10 554 AG que cuentan con la simbologa, arroja los
siguientes resultados:

En las 10 554 reas con simbologa el porcentaje de AG sin vivienda en la zona


urbana es de un 53%, lo cual requiere que la DIG genere un proceso de actualizacin
en miras al prximo Censo 2005.

Al tomar nicamente las AG reportadas con viviendas (4 992), un 13% no existe en el


Censo 2005; sin embargo, el total de AG en esta condicin es de nicamente 644
(cuadro 6).

Las 644 AG inexistentes en el Censo 2005 corresponden tanto a municipios grandes,


por ejemplo, Medelln, Cali, Barranquilla, como a ciudades intermedias y pequeas
(cuadro 7).

La compensacin es un proceso de ajuste por no cobertura geogrfica en aquellos municipios donde el


censo no se pudo realizar y se recogi informacin secundaria a travs de las entidades locales.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

11

Cuadro 6
AG con viviendas, segn existencia en el Censo 2005
Concepto

Frecuencia

Total
No existen
Existen

4 992
644
4 348

Porcentaje
100,0
12,9
87,1

Fuente: DANE Censo General 2005

Cuadro 7
AG inexistentes en el Censo 2005, segn municipio
Municipios
Total
Medelln
Apartad
Barranquilla
Baranoa
Malambo
Sabanalarga
Soledad
Cartagena
Arjona
El Carmen de Bolvar
Magangu
Tunja
Chiquinquir
Sogamoso
Manizales
Chinchin
Villamara
Florencia
Puerto Tejada
Santander de Quilichao
Valledupar
Aguachica
Agustn Codazzi
Montera
Ceret
Lorica
Planeta Rica
Girardot
La Mesa
Madrid
Mosquera

Frecuencia
644
39
1
36
3
3
6
12
3
1
2
7
9
1
1
28
2
4
11
5
5
44
4
1
11
1
1
1
84
1
1
1

Porcentaje
100,0
6,1
0,2
5,6
0,5
0,5
0,9
1,9
0,5
0,2
0,3
1,1
1,4
0,2
0,2
4,3
0,3
0,6
1,7
0,8
0,8
6,8
0,6
0,2
1,7
0,2
0,2
0,2
13
0,2
0,2
0,2

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

12

Cuadro 7 (conclusin)
AG inexistentes en el Censo 2005, segn municipio
Municipios

Frecuencia

Tena
Zipaquir
Quibd
Neiva
Pitalito
Riohacha
Maicao
Santa Marta
Cinaga
Villavicencio
Acacas
Pasto
Ipiales
Ccuta
Los Patios
Ocaa
Villa del Rosario
Armenia
Calarc
Montenegro
Bucaramanga
Barrancabermeja
Floridablanca
Girn
Piedecuesta
Sincelejo
Corozal
Ibagu
Cali
Buenaventura
Buga
Cartago
Jamund
Palmira
Pradera
Tulu
Yumbo
Arauca
Yopal
San Andrs

1
5
2
1
1
5
9
5
5
9
1
21
1
2
14
2
4
8
1
2
19
9
15
4
1
9
1
18
88
2
4
5
3
1
1
18
7
6
4
1

Porcentaje
0,2
0,8
0,3
0,2
0,2
0,8
1,4
0,8
0,8
1,4
0,2
3,3
0,2
0,3
2,2
0,3
0,6
1,2
0,2
0,3
3
1,4
2,3
0,6
0,2
1,4
0,2
2,8
13,7
0,3
0,6
0,8
0,5
0,2
0,2
2,8
1,1
0,9
0,6
0,2

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

13

No se considera procedente que con menos de 1 000 AG no detectadas en el Censo


2005 y sin que se haya realizado una mayor profundizacin en el problema, hacer
inferencias sobre la cobertura censal.
Fuente probable de error: en la distribucin de la poblacin por clase, el error probable
podra atribuirse a la cartografa, ya fuera por desactualizacin o porque no permita la
delimitacin exacta del municipio, pero tambin a problemas en la organizacin y
realizacin del operativo.
En el segundo de los casos, a pesar de las razones enunciadas (conversin en municipio,
desaparicin, contado como parte del rural disperso), no puede descartarse que
eventualmente exista un problema de cobertura asociado a la no deteccin de los
mencionados centros.
En la no identificacin de AG en el Censo 2005, adems de la cartografa y la
organizacin y ejecucin del operativo, surge otra fuente probable de error, el que la
mayor parte de las AG no cuenta con simbologa.
Recomendaciones:

De aplicacin inmediata: en coordinacin con la DIG, debe adelantarse un trabajo de


escritorio para validar los resultados obtenidos; y de acuerdo con los resultados,
determinar si se considera procedente llevar a cabo investigacin en terreno, mediante
una muestra de municipios, para determinar la existencia de centros poblados o AG
no existentes como tal en el Censo 2005.

Para futuros censos: actualizar la base de georreferenciacin, de forma tal que


incorpore las AG con creacin cercana al Censo 2005; y que todas las AG cuenten
con simbologa. A partir de esa base y de otros insumos, generar los mecanismos
para el aseguramiento de la cobertura, paralelo a la recoleccin de la informacin.

2.1.2 Edad
La recoleccin de la informacin mediante DMC y la incorporacin de la fecha de
nacimiento como control de la edad, mejora significativamente la calidad de la informacin
de la variable bsica del Censo 2005: la edad.
Los tres ndices analizados muestran que la informacin capturada en los DMC se
encuentra en rangos de buena calidad. Cuando la captura es en papel, y posteriormente
grabada en DMC; en dos de los ndices (Naciones Unidas y Myers) la informacin an se
encuentra en los lmites de aceptabilidad, ms no en el tercero (Whipple), cuando el valor
(110,85) corresponde a datos aproximados (tabla 1).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

14

Tabla 1
Indicadores de la calidad de la informacin relacionada con la edad
Indicador
de calidad

Definicin del
indicador

Muestra la mala
declaracin de la
Naciones
edad y la
Unidas
preferencia de
dgitos
Evala la atraccin
o rechazo que se
Myers
dio en la
resumen declaracin de la
edad en los dgitos
finales

Whipple

Muestra la mala
declaracin de la
edad, respecto a la
preferencia de los
dgitos 0 y 5

Parmetro de comparacin

Resultados de calidad censal


Cuestionario
Total
Captura en papel y Papel y
nacional en DMC grabada en escner
DMC

<20 Satisfactorio
20 y 40 De calidad intermedia

10,30

10,40

11,70

20,00

1,93

1,77

4,45

6,28

103,49

103,03

110,85

116,67

>40 Indican informacin


deficiente
0,0 a 5,0 Bajo
5,1 a 15,0 Mediano
15,1 a 30,0 Alto
30,1 y ms Muy alto
100 a 105 Muy precisos
105 a 110 Relativamente
precisos
110 a 125 Datos aproximados
125 a 175 Datos malos
175 y ms Datos muy malos

Fuente: DANE Censo General 2005

Cuando la recoleccin se realiza mediante papel y luego se graba mediante escner, la


informacin, segn los tres indicadores es de calidad media. Con la ltima estrategia
nicamente se recopil y grab el 2,3% de la informacin; mientras que con slo DMC se
captur cerca del 95% (tabla 2).

Tabla 2
Personas en la base, segn alternativa de recoleccin y grabacin
Medio de captura
Captura en DMC
Papel trascripcin DMC
Papel - escner

Personas

Porcentaje

39 248 930
1 253 533
965 921

94,5
3,0
2,5

Fuente: DANE Censo General 2005

En el grfico 1 puede observarse que la distribucin por edades del Censo 2005 es mejor
en comparacin con la del Censo 1993, al no ser tan marcada las preferencias de dgitos.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

15

Grfico 1
Distribucin de la poblacin, por edades simples
Censos 1985, 1993 y 2005
1,000,000
2005
900,000

1993

800,000

1985

Poblacin

700,000
600,000
500,000
400,000
300,000
200,000
100,000
0

10

15

20

25

30

35

40

45

50

55

60

65

70

75

80

85

90

95

Edad

Fuente: DANE

A pesar de las notorias mejoras en la calidad de la informacin sobre la edad, existen


aspectos de inters que llaman la atencin:

A pesar de que se control por fecha de nacimiento, lo cual reduce significativamente


la preferencia de dgitos, an se observan pequeos abultamientos en las edades
terminadas en 0 y 5.

El primer grupo de edad presenta un comportamiento atpico, no explicado por


mortalidad infantil o en eventuales incrementos de la fecundidad en el ao antes del
Censo 2005: alto en el grupo de edad 0, baja en los tres siguientes (1, 2, 3) y se
incrementa para el de 4 aos.

La comparacin base cruda y base final: el primer ejercicio corresponde a validar los
cambios experimentados por la estructura de edades entre la base cruda y la base final
una vez se ha realizado el proceso de depuracin de la informacin. De esta comparacin
se desprende:

Los valores perdidos (missing) de la edad en la base cruda son nicamente 31 530
(perdidos: 21 636; cdigo 99: 9 888; cdigo 999: 6) que corresponden al 0,08% del total
(cuadro 8).

No existe diferencia significativa por edad entre los valores de la base cruda y la final.

La poblacin menor de 1 ao se reduce en 9 671 personas entre la base cruda y la final.

De existir sobrestimacin en la edad 0, esta no proviene de los procesos de depuracin


de la informacin.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

16

Cuadro 8
Distribucin de la poblacin, por base, segn grupos de edad
Base cruda
Base final
Edad (aos)
Personas Porcentaje
Personas
Porcentaje
Total
41 143 329
100,0
41 174 853
100,0
0
865 602
2,1
855 931
2,1
1-4
3 244 372
7,9
3 250 052
7,9
5-9
4 291 303
10,4
4 290 594
10,4
10 - 14
4 325 904
10,5
4 325 890
10,5
15 - 19
3 879 808
9,4
3 885 257
9,4
20 - 24
3 554 928
8,6
3 560 869
8,6
25 - 29
3 236 136
7,9
3 241 664
7,9
30 - 34
2 890 379
7,0
2 895 677
7,0
35 - 39
2 898 382
7,0
2 903 378
7,1
40 - 44
2 716 091
6,6
2 721 239
6,6
45 - 49
2 278 243
5,5
2 283 328
5,5
50 - 54
1 824 693
4,4
1 829 635
4,4
55 - 59
1 441 171
3,5
1 446 203
3,5
60 - 64
1 094 873
2,7
1 100 559
2,7
65 - 69
910 696
2,2
916 133
2,2
70 - 74
692 096
1,7
696 740
1,7
75 - 79
493 288
1,2
497 309
1,2
80 - 84
269 844
0,7
272 275
0,7
85 y ms
235 520
0,6
202 120
0,5
Fuente: DANE Censo General 2005

Coherencia de la informacin: los nacimientos ocurridos en el ao censal y en los 4


aos anteriores, a pesar del subregistro que experimentan, son un buen referente para
mirar la coherencia de los resultados censales en los primeros aos de vida. Bajo el
supuesto que el porcentaje de subregistro permanece en niveles similares en el perodo,
se observa que el patrn entre nacimiento y poblacin censal, es similar a partir del primer
ao de vida (la diferencia con respecto a los nacimientos, oscila entre el 13% y el 15%);
no as entre los nacidos vivos en 2005 y la poblacin menor de 1 ao, en donde la brecha
se ampla y la diferencia relativa alcanza el 19% (grfico 2).
Aunque la evidencia externa indica sobrestimacin de la poblacin menor de un ao, es
preciso aunar mayor evidencia para poder precisar si existen desviaciones significativas
frente al patrn de comportamiento esperado, relacionado anteriormente.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

17

Grfico 2
Nacimientos en los ltimos aos (2001-2005) y poblacin de 0 a 4 aos
Base final
Nacimientos
Observada

900

Poblacin (miles)

850

800

750

700

650

600
2005 (0)

2004 (1)

2003 (2)

2002 (3)

2001 (4)

Ao nacimiento y edad

Fuente: DANE Censo General 2005

Fuente probable de error: de no existir error en la asignacin de la edad, se esperara


que el patrn por edad de la poblacin que no report la fecha de nacimiento, fuera similar
al de la poblacin que s lo hizo.
Grfico 3
Base cruda. Distribucin de la poblacin de 20 aos y menos
segn la presencia de valores perdidos
2005
950 000
900 000

Poblacin

850 000
800 000
750 000
700 000
Total

650 000

Con fecha Nac.


600 000
0

10

11

12

13

14

15

16

17

18

19

20

Edades simples

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

18

En la base cruda existen cerca de 1,9 millones de personas para las que no se cuenta con
la fecha de nacimiento. Seleccionando la poblacin de 20 aos y menos, se observa que
la estructura por edades simples de la poblacin total (incluye a quienes no declararon
fecha de nacimiento), es similar, a partir de la edad 1, con la de la poblacin que no
considera los valores perdidos para la fecha de nacimiento; pero no es as para la edad 0,
en donde el patrn es contrario al esperado.
La evidencia externa y la derivada del Censo 2005, muestra la existencia de sobrestimacin en la edad cero (0), las fuentes probables o hipotticas de error y difcilmente
demostrables, se encontraran en:

Problemas de capacitacin que impedan al encuestador conocer cabalmente el


tratamiento de la poblacin para la que se desconoca la fecha de nacimiento.

Asignacin consciente por parte del encuestador de la edad 0, para no realizar


preguntas sobre otras variables y acortar as el tiempo de la encuesta.

Problemas de supervisin para detectar oportunamente la calidad de la informacin


que se estaba recogiendo.

Problemas de configuracin, especialmente en el componente regional, que define


separacin de decimales, fecha, etc., lo cual es importante para la validacin de la
edad declarada.

Balance e impacto sobre algunos indicadores:

La utilizacin de la tecnologa mejora significativamente la distribucin por edad de la


poblacin y por tanto, puede afirmarse que la informacin es, en trminos generales,
superior a la que arrojan los censos anteriores.

Los procesos de depuracin de la informacin estn bien realizados y contribuyen a


mejorar la calidad de la informacin.

Cuando no se suministra la fecha de nacimiento, eventuales fallas en los DMC, la


capacitacin y supervisin conducen a que a algunas personas se les asigne edad 0
(cero), sin que esa sea su verdadera edad. El error no se corrige por procesos de
imputacin, en la medida en que la formulacin de este tipo de normas no es posible,
dado que implicara realizar intervenciones tcnicamente no aceptables.

El primer impacto importante de una sobrestimacin de la poblacin menor de un ao


es sobre las proyecciones de poblacin. De no corregirse o suavizarse la estructura
por edad, van a generarse errores acumulativos en el tiempo.

Para algunos programas de gobierno, por ejemplo vacunacin de infantes, puede


llevar a una sobrestimacin de los requerimientos reales.

Algunos de los indicadores que se generan con base en la poblacin menor de 5 aos
pueden verse afectados, como:
-

Relacin hijos-mujer
Hijos sobrevivientes/hijos nacidos vivos

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

19

Estimacin de la mortalidad infantil por mtodos indirectos que toman como referencia la poblacin de 0 aos.

Recomendaciones:
Para la utilizacin de la informacin:

La sobrestimacin de la poblacin de 0 aos es de particular importancia en el


momento de realizar proyecciones de poblacin; se recomienda suavizar o corregir las
estructuras mediante multiplicadores u otras tcnicas diseadas para el efecto. Es
preciso sealar que la suavizacin fue realizada en el proceso de conciliacin para
garantizar la estructura de la poblacin base de las proyecciones.

En la construccin y anlisis de indicadores que utilizan la poblacin de 0 aos, deben


tomarse en consideracin las limitantes que trae la sobrestimacin detectada.

Para futuros censos:

La tecnologa y software de captura que vaya a utilizarse debe estar lo


suficientemente probada, validada y configurada antes de iniciar el operativo censal.

Prestar especial atencin a los procesos de capacitacin y supervisin.

2.1.3 Sexo
El principal punto de inters relacionado con la calidad de los datos sobre el sexo de las
personas, est relacionado con la cobertura diferencial de ellos; al respecto, la pirmide
de poblacin por edades simples (grfico 4) refleja algunos aspectos de inters:

Muestra la regularidad sealada en el anlisis de la edad

Refleja la sobrestimacin de la poblacin menor de 1 ao

Entre los 20 y los 40 aos, la regularidad del descenso en la importancia relativa de la


poblacin, se pierde y aparecen muescas o hendiduras en los dos sexos. La violencia,
que afecta en especial a los hombres en estas edades y la emigracin al exterior, con
mayor intensidad en las mujeres, pueden ser algunas de las causas de este
comportamiento de la pirmide.

La comparacin base cruda y base final: la probabilidad de que se presente errores de


la variable sexo en la incorporacin en los DMC o en el papel, es mucho menor que en las
restantes variables. En la base cruda existen nicamente 9 888 (0,02%) valores perdidos.
Una vez efectuada la depuracin de la informacin, la estructura de la poblacin por sexo
no cambia entre una base y otra (cuadro 9). Se puede concluir que el proceso de
depuracin destinado a corregir problemas de la variable sexo, por no coherencia con
otras variables o no reportado, fue adecuado.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

20

Grfico 4
Pirmide de poblacin, por edades simples y sexo
Censo 2005
114
112
110
108
106
104
102
100
98
96
94
92
90
88
86
84
82
80
78
76
74
72
70
68
66
64
62
60
58
56
54
52
50
48
46
44
42
40
38
36
34
32
30
28
26
24
22
20
18
16
14
12
10
8
6
4
2
0

Mujeres
Hombres

1%

Fuente: DANE Censo General 2005

Cuadro 9
Distribucin de la poblacin, por sexo y base, segn grupos de edad
2005
Hombres (%)
Mujeres (%)
Grupos de edad
(aos)
Final
Cruda
Final
Cruda
Total
100,0
100,0
100,0
100,0
0-4
10,5
10,5
9,5
9,5
5-9
10,9
10,9
9,9
10,0
10 - 14
11,0
11,0
10,0
10,1
15 - 19
9,6
9,6
9,3
9,3
20 - 24
8,5
8,5
8,8
8,8
25 - 29
7,7
7,7
8,0
8,0
30 - 34
6,9
6,9
7,2
7,2
35 - 39
6,9
6,9
7,2
7,2
40 - 44
6,4
6,4
6,8
6,7
45 - 49
5,4
5,4
5,7
5,7
50 - 54
4,3
4,3
4,5
4,5

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

21

Cuadro 9 (conclusin)
Distribucin de la poblacin, por sexo y base, segn grupos de edad
2005
Hombres (%)
Mujeres (%)
Grupos de edad
(aos)
Final
Cruda
Final
Cruda
55 - 59
3,4
3,4
3,6
3,6
60 - 64
2,6
2,6
2,7
2,7
65 - 69
2,1
2,1
2,3
2,3
70 - 74
1,6
1,6
1,8
1,8
75 - 79
1,1
1,1
1,3
1,3
80 - 84
0,6
0,7
0,7
0,8
85 - 89
0,4
0,4
0,6
0,5
Fuente: DANE Censo General 2005

Coherencia de la informacin con fuentes externas: existen diferentes fuentes que pueden arrojar indicadores sobre la calidad de la informacin recolectada en el Censo 2005; el
primero de ellos corresponde a la relacin de masculinidad a la edad 0, la cual es una aproximacin que muestra por cada 100 nias, cuntos nios nacen. De acuerdo con el Censo
2005, la relacin es de 106,6, valor que es mayor, comparativamente con lo observado en
el Censo 1993 y en pases para los cuales se pudo obtener informacin, en donde, la relacin es inferior a 105 hombres por cada 100 mujeres (tabla 3). El diferencial observado
estara posiblemente evidenciando, en comparacin con el gnero masculino, un
subregistro de mujeres en el Censo 2005.
Tabla 3
Relacin de masculinidad a la edad 0, segn pases seleccionados y censos
Relacin de masculiPas
Ao del censo
nidad edad 0
Colombia
2005
106,6
Colombia
1993
104,8
Argentina
2001
103,8
Espaa
2001
104,9
Costa Rica
2000
104,5
Chile
2002
104,4
Uruguay
2004
103,9
Guatemala
2002
101,9
Chile
1992
104,7
Paraguay
1992
103,2
Fuente: DANE Censo General 2005

El subregistro es diferencial por departamento, 18 de ellos presenta valores superiores al


promedio nacional y en 3, la relacin supera los 113 hombres por cada 100 mujeres. En el
otro extremo, en Guaina, Vaups y Putumayo, la relacin es inferior a 100.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

22

Vichada

S. Andres

Guaviare

N. Santander

Sucre

Magdalena

Bolivar

Risaralda

Arauca

Csar

Quindo

Caldas

Atlntico

Meta

Santander

Crdoba

Amazonas

Pais

Bogot

Boyac

Huila

Tolima

Antioquia

Valle

Nario

Cauca

Caquet

Cundinamarca

Choc

La Guajira

Casanare

Vaups

Putumayo

1,25
1,22
1,19
1,16
1,13
1,1
1,07
1,04
1,01
0,98
0,95
0,92
0,89
0,86
0,83
0,8
Guaina

R. M.

Grfico 5
Relacin de masculinidad a la edad 0, por departamento
2005

Fuente: DANE Censo General 2005

Un segundo indicador externo corresponde a la comparacin entre las relaciones de


masculinidad observadas en el Censo, con las que se derivan de la Encuesta Continua de
Hogares 2005 y de la Encuesta de Calidad de Vida 20035. En la primera de ellas, se tom
informacin de un poco ms de 151 000 hogares; en la segunda, de nicamente un poco
ms de 10 000 (grfico 6).
Grfico 6
Relacin de masculinidad para grupos de edad, segn fuente de informacin
Censo 2005, ECH 2005 y ECV 2003
105,0
100,0
95,0
90,0
85,0
R. M .
80,0
75,0
70,0
65,0
60,0
0 - 19

20 - 39

40 -- 59

60 y ms

Grupos de edad

Total

Censo
EH
ECV

Fuente: DANE Censo General 2005

La comparacin de la informacin del Censo 2005 con la que se obtiene en encuestas por muestreo, se lleva
a cabo para observar similitud o no en los patrones de comportamiento de las variables, ya que no pueden
estimarse diferenciales precisos, debido a los errores de muestreo asociados a las encuestas y las distintas
estructuras implcitas en cada una de las fuentes.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

23

El Censo ha sido siempre el referente para evaluar la calidad de otras fuentes de informacin; no obstante, no debe descartarse los indicadores generados con base en esas otras
fuentes, en particular, cuando se desea analizar la calidad de la informacin censal.
A pesar de las limitaciones anotadas sobre la validez de las comparaciones con los
resultados de las encuestas por muestreo (efecto estructura), se observa que en todos
los grupos de edad seleccionados, el valor de las relaciones de masculinidad es menor
al obtenido en el Censo 2005 (cuadro 10). En una primera instancia podra hablarse de
un subregistro de mujeres mayor que el de los hombres en el Censo 2005; no obstante,
es necesario profundizar en el anlisis de otros indicadores que sustenten o nieguen
este supuesto.
Cuadro 10
Relaciones de masculinidad, por fuente, segn grupos de edad
Censo 2005, ECH 2005 y ECV 2003
Grupos
Censo 2005
Encuesta de Hogares 2005
de edad
Hombres
Mujeres
RM Hombres
Mujeres
RM
(aos)
Total
20 101 180 21 073 673 95,4 21 508 375 23 067 356 93,2
0 - 19
8 441 527 8 166 197 103,4 9 024 776 8 766 202 102,9
20 - 39
6 023 475 6 578 113 91,6 6 249 289 7 063 563 88,5
40 - 59
3 940 108 4 340 297 90,8 4 219 552 4 796 320
88
60 y
ms
1 696 070 1 989 066 85,3 2 014 758 2 441 272 82,5

Calidad de Vida 2003


Hombres
20 856 959
9 012 994
6 205 505
3 804 023

Mujeres

RM

22 860 619 91,2


8 944 137 100,8
7 113 155 87,2
4 522 274 84,1

1 834 438 2 281 054

80,4

Fuente: DANE Censo General 2005

Los jefes de hogar que se declaran en unin y que su pareja no se encontraba en el


momento del Censo 2005 tenan varias opciones: (1) declararla como residente habitual;
(2) declarar su estado conyugal real y no declarar la pareja; y (3) cambiar el estado
conyugal para no tener que declarar el cnyuge. Las opciones 2 y 3 se convierten en
prdida de personas en el Censo 2005 y, por tanto, en no cobertura. El Censo 2005
permite tener una aproximacin nicamente al segundo de los efectos.
En el Censo 2005, 6,6 millones de jefes de hogar se declararon en unin; de ellos el 5,4%
(359 458) inform que el(la) cnyuge no estaba presente en el momento del censo. Este
eventual subregistro corresponde casi en su totalidad a mujeres; ellas representan
nicamente el 5,5% (364 137) del total de jefes de hogar en unin con cnyuge presente
cuando se cens (cuadro 11).
Cuadro 11
Jefes en unin sin pareja presente en el momento
del Censo 2005
Presencia de la pareja
Total
Hombres con pareja presente
Mujeres con pareja presente
Jefes sin pareja presente

Frecuencia

Porcentaje

6 649 901
5 926 306
364 137
359 458

100,0
89,1
5,5
5,4

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

24

Cuadro 12
Jefes en unin, por presencia del cnyuge, segn departamento
2005
Con pareja
Departamento
Total
PorcenRecuento
taje*
Total
Antioquia
Atlntico
Bogot, D.C.
Bolvar
Boyac
Caldas
Caquet
Cauca
Cesar
Crdoba
Cundinamarca
Choc
Huila
La Guajira
Magdalena
Meta
Nario
Norte de Santander
Quindo
Risaralda
Santander
Sucre
Tolima
Valle del Cauca
Arauca
Casanare
Putumayo
Archipilago de San Andrs,
Providencia y Santa Catalina
Amazonas
Guaina
Guaviare
Vaups
Vichada

Sin Pareja
Recuento

Porcentaje*

6 649 901
883 338
331 645
1 147 862
283 036
201 862
151 159
49 238
182 468
136 549
227 174
383 355
46 137
167 686
80 881
177 195
117 143
226 633
191 098
85 502
141 159
321 210
119 327
219 775
643 218
22 325
47 154
30 711

6 290 443
834 396
312 067
1 101 921
265 173
191 856
142 738
45 895
171 136
127 812
217 048
368 325
39 837
160 352
72 251
167 265
109 718
216 078
181 656
80 017
132 098
304 405
112 304
207 112
603 189
20 910
44 531
27 706

94,6
94,5
94,1
96,0
93,7
95,0
94,4
93,2
93,8
93,6
95,5
96,1
86,3
95,6
89,3
94,4
93,7
95,3
95,1
93,6
93,6
94,8
94,1
94,2
93,8
93,7
94,4
90,2

359 458
48 942
19 578
45 941
17 863
10 006
8 421
3 343
11 332
8 737
10 126
15 030
6 300
7 334
8 630
9 930
7 425
10 555
9 442
5 485
9 061
16 805
7 023
12 663
40 029
1 415
2 623
3 005

5,4
5,5
5,9
4,0
6,3
5,0
5,6
6,8
6,2
6,4
4,5
3,9
13,7
4,4
10,7
5,6
6,3
4,7
4,9
6,4
6,4
5,2
5,9
5,8
6,2
6,3
5,6
9,8

9 886
6 396
2 748
7 459
2 428
6 144

9 258
5 928
2 556
6 932
2 327
5 646

93,6
92,7
93,0
92,9
95,8
91,9

628
468
192
527
101
498

6,4
7,3
7,0
7,1
4,2
8,1

Fuente: DANE Censo General 2005


* Porcentaje de fila

Por departamento el diferencial cambia: en Bogot, D.C., Cundinamarca, Nario, Huila,


Norte de Santander y Vaups, la omisin estara por debajo del 5%; mientras que en la
mayor parte de los nuevos departamentos (antiguos territorios nacionales), el porcentaje
supera el 7% y en el Choc y La Guajira supera el 10% (cuadro 12).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

25

La comparacin con censos anteriores muestra que la relacin de masculinidad crece en


los primeros 6 grupos de edad, esto refleja el efecto acumulado de las cada vez mejores
condiciones de salud, tanto en tecnologa, como en la afiliacin de la poblacin a los
sistemas de salud; factores que tienden a cerrar la brecha entre la mortalidad masculina y
femenina, principalmente, en los primeros aos de vida.
En los grupos de edad 30-34 y 35-39 aos, las relaciones de masculinidad son similares, a
partir de los 40 aos el patrn cambia, las relaciones de masculinidad son significativamente
ms altas en los censos anteriores que en el de 2005 (grfico 7); la explicacin de este
comportamiento no se ha precisado y se considera que amerita la realizacin de un estudio
especfico para su anlisis.

Grfico 7
Relacin de masculinidad, por grupos quinquenales de edad, segn base
Censos 1985, 1993 y 2005

110.0
105.0

95.0
90.0
85.0
80.0
75.0

Cruda
70.0

85 y ms

80 - 84

75 - 79

70 - 74

65 - 69

60 - 64

55 - 59

50 - 54

45 - 49

40 - 44

35 - 39

30 - 34

25 - 29

Censo 85
20 - 24

60.0

10 -14

Censo 93
5-9

65.0

15 - 19

Final

0-4

Relacin Masculinidad

100.0

Grupos de edad
Fuente: DANE

Fuente probable de error: en relacin con el primero de los problemas detectados, la fuente de error es la omisin consciente o involuntaria del informante, que afecta en particular el
registro de las nias menores de un ao, lo cual indicara una cobertura diferencial por sexo,
siendo mayor el subregistro de mujeres.
De la comparacin con otras fuentes no surge la suficiente evidencia sobre la existencia
de limitaciones de la informacin del Censo 2005 relacionada con el sexo.
Balance e impacto sobre algunos indicadores: los procesos de depuracin de la informacin relacionada con el sexo estn bien realizados. El impacto importante de un subregistro
diferencial entre hombres y mujeres, en particular en la poblacin menor de un ao, es

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

26

sobre las proyecciones de poblacin, en la medida en que, de no corregirse las


desigualdades, van a mantenerse en el tiempo.
El problema afecta a la mayor parte de los departamentos del pas; en unos (la mayora),
porque la relacin de masculinidad a la edad 0 es muy alta, y en otros, porque estn por
debajo de cualquier consideracin sobre los valores esperados de la relacin.
Recomendaciones: al igual que con la edad, altas relaciones de masculinidad a la edad
0, a nivel del pas, y significativos diferenciales a nivel departamental, afectan las lneas
de base para la realizacin de las proyecciones de poblacin La recomendacin, ya
considerada en el proceso de conciliacin, es la de corregir el desbalance que se presenta en la distribucin por sexo.
Adelantar un estudio especfico en el que se profundice sobre la explicacin de las relaciones de masculinidad, particularmente las que se observan despus de los 30 aos.

2.1.4 Parentesco
Comparacin base cruda y base final: en la base cruda aparecen 140 mil valores no
vlidos para la variable parentesco (valores perdidos: 93 239; cdigo 0: 46 845). Al pasar
de la base original a la final, la estructura se conserva, indicativo de un adecuado proceso
de depuracin (cuadro 13).
Cuadro 13
Relacin de parentesco, por base
Censo 2005
Parentesco
Total
Jefe
Cnyuge
Hijo/hijastro
Yerno/nuera
Nieto
Padre/suegro
Hermano/hermanastro
Otro pariente
Empleado
No pariente

Base cruda
PorcenPersonas
taje
100,0
41 034 769
25,7
10 532 918
16,2
6 644 689
41,9
17 207 967
1,1
462 927
6,4
2 632 456
1,4
591 164
1,7
717 368
2,9
1 189 710
0,4
165 264
2,2
890 306

Base final
PorcenPersonas
taje
100,0
41 174 853
25,7
10 570 899
15,9
6 534 002
41,8
17 216 983
1,1
455 505
6,4
2 639 352
1,4
578 533
1,7
716 606
3,2
1 302 198
0,4
164 765
2,4
996 010

Fuente: DANE Censo General 2005

Coherencia de la informacin con fuentes externas: al compararse los resultados del


Censo con otras fuentes, los de la Encuesta de Hogares y los de la de Calidad de Vida
son prcticamente iguales (cuadro 14).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

27

Cuadro 14
Relacin de parentesco, por fuente de informacin y sexo
Encuesta de Hogares
Censo 2005
2005
Parentesco
Hombre
Mujer
Hombre
Mujer
Total
48,8
51,2
48,3
51,7
Jefe
70,1
29,9
70,5
29,5
Cnyuge
6,7
93,3
5,7
94,3
Hijo/hijastro
52,0
48,0
52,7
47,3
Otros parientes
48,4
51,6
46,4
53,6
No parientes
47,2
52,8
41,3
58,7

Calidad de Vida
2003
Hombre
Mujer
47,7
52,3
69,1
30,9
5,0
95,0
51,2
48,8
47,2
52,8
43,5
56,5

Fuente: DANE

Balance e impacto sobre los resultados: los procesos de depuracin efectuados y su


coherencia con fuentes externas indican que la informacin sobre el parentesco no
presenta limitantes para su utilizacin confiable.

2.1.5 Estado conyugal


Comparacin base cruda y base final: para la variable estado conyugal, en la base
cruda se presentan 729 621 valores perdidos y 26 489 con cdigo 0. Una vez se realiza la
depuracin permanecen 695 211 registros como no informa (cuadro 15).

Cuadro 15
Distribucin de la poblacin de 10 y ms aos, por base, segn por estado conyugal
Censo 2005
Base cruda
Base final
Estado conyugal
PorcenPorcenPersonas
Personas
taje
taje
Total
100,0
31 985 942
100,0
32 083 165
Unin libre (2 o ms)
21,1
6 514 515
20,4
6 777 319
Unin libre (menos de 2)
2,0
608 197
1,9
629 419
Separado
5,0
1 642 900
5,1
1 601 764
Viudo
4,2
1 361 164
4,3
1 344 019
Soltero
44,6
14 471 862
45,2
14 316 559
Casado
23,1
7 387 304
23,1
7 414 085
Fuente: DANE Censo General 2005

Coherencia de la informacin con fuentes externas: la informacin sobre el estado


conyugal es coherente con la que arrojan otras fuentes de informacin, lo cual es un buen
indicativo de la consistencia y calidad de esta variable (cuadro 16).
Balance e impacto sobre los resultados: los procesos de depuracin efectuados y su
coherencia con fuentes externas indican que la informacin sobre el estado conyugal no
presenta limitantes para su utilizacin confiable.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

28

Cuadro 16
Distribucin de la poblacin de 10 y ms aos, por fuente, segn estado conyugal
Encuesta de Hogares
Calidad de Vida
Censo 2005
Estado
2005
2003
Conyugal
Poblacin Porcentaje
Poblacin Porcentaje
Poblacin
Porcentaje
Total
31 985 942
100,0
35 614 633
100,0
34 703 329
100,0
Unin libre
7 122 712
22,3
7 601 464
21,3
7 486 428
21,6
Casado
7 387 304
23,1
8 423 664
23,7
8 219 662
23,7
Separado
1 642 900
5,1
1 747 380
4,9
1 752 758
5,1
Viudo
1 361 164
4,3
2 699 446
7,6
2 749 666
7,9
Soltero
14 471 862
45,2
15 142 679
42,5
14 494 815
41,8
Fuente: DANE

2.1.6 Pertenencia tnica


Comparacin base cruda y base final: los valores relativos estn dentro de los
mrgenes de error establecido (inferiores a 1 punto porcentual); no obstante, la poblacin
absoluta por pertenencia tnica cambia sustancialmente, as: los Rom6, que en la base
cruda superaban las 45 mil personas, en la base final son slo 4 700; de la misma forma,
los palenqueros7 en la primera base sumaban ms de 27 000, en la segunda, se reducen
a 7 459 (cuadro 17).
Cuadro 17
Pertenencia tnica, por base
2005
Base cruda
Etnia
PorcenFrecuencia
taje
Total
41 174 853
100,0
Indgena
1 388 970
3,4
Rom
45 361
0,1
Raizal
30 278
0,1
Palenquero
27 378
0,1
Negro
4 231 405
10,3
Ninguna
34 590 686
84,0
No informa
860 775
2,1

Base final
PorcenFrecuencia
taje
41 174 853
100,0
1 388 985
3,4
4 700
0,0
30 359
0,1
7 459
0,0
4 251 019
10,3
34 631 579
84,1
860 752
2,1

Fuente: DANE Censo General 2005

Para el caso del autorreconocimiento tnico, opcin Rom, en las primeras revisiones de
los datos preliminares se identificaron deficiencias en la capacitacin, dado que se estaba
reportando un volumen de poblacin muy superior al obtenido en los estudios realizados
sobre este grupo poblacional, ms concretamente en los efectuados por ProRom.
Para corregir este inconveniente se produjeron instrucciones precisas en capacitacin en
pldoras enviadas a los coordinadores operativos para que las socializaran entre el
6

Denominacin con la que tambin se conoce al pueblo gitano.


Poblacin nacida en el centro poblado de San Basilio de Palenque, municipio de Mahates, departamento de
Bolvar.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

29

personal de recoleccin: supervisores y encuestadores. Para corregir la informacin


recopilada, se aplicaron normas de imputacin referidas al lugar de residencia, en las que
se identificaron los municipios en donde se tena certeza que all residan Rom; para el
caso de Bogot, D.C., se seleccionaron las localidades y los barrios. En segundo lugar, se
tom el nivel educativo, dado que, segn los documentos disponibles, por tradicin y por
cultura, este grupo poblacional no alcanza estudios de postgrado y los mayores de 50
aos, la secundaria.
La evaluacin realizada por el DANE de la informacin durante el proceso de recoleccin,
permiti ajustar este proceso, lo cual evit que el total identificado no fuese mayor, esto
muestra un factor importante en la realizacin en varios das de la recoleccin.
Para el caso de la opcin Palenquero de San Basilio, se identific que en los formularios
de la fase 0, 1 y 2, esta opcin no se haba incluido. Una vez se realiz el proceso de
consolidacin de la base cruda final, se homolog dicha variable para que la poblacin
residente en el municipio de Mahates (Bolvar) en clase 2 (San Basilio de Palenque) se
considerara como palenquera.
Fuente probable de error: en el caso de la poblacin Rom las fuentes de error fueron de
capacitacin en los conceptos bsicos y de supervisin. Al parecer algunos encuestadores y encuestados no conocan el significado de la palabra Rom; el problema no fue
detectado por la supervisin del operativo de recoleccin, agentes externos a l llamaron
la atencin sobre lo que estaba sucediendo.
En relacin con la tercera fuente de error se sugiere que a la palabra Rom debi adicionrsele o gitano; sin embargo, es preciso sealar que durante la prueba experimental de
Soacha se probaron las diferentes alternativas y se lleg a la conclusin que la mejor fue
la que finalmente qued en el formulario.
Balance e impacto sobre los resultados: el anlisis de la informacin con las
organizaciones que representan a la poblacin Rom y estudios realizados, avalan los
correctivos realizados.
2.1.7 Fecundidad
Comparacin base cruda y base final: tres variables se utilizan para mirar la fecundidad: mujeres en edad reproductiva y si han tenido hijos nacidos vivos o no, el nmero
de hijos nacido vivos (HNV) y el ao y mes del ltimo HNV (cuadro 18).
En la base cruda y en la final 11,1 millones de mujeres estn en edad reproductiva; de
ellas cerca de 370 no informan sobre si han tenido hijos vivos o no. Al igual que con otras
preguntas, debera existir un control que obligara a que todas las mujeres en edad
reproductiva reportaran la tenencia de hijos nacidos vivos.
Al pasar de la base cruda a la final, los valores absolutos varan muy poco y las
estructuras permanecen idnticas. Igual sucede con el ao y mes del ltimo hijo nacido
vivo, lo cual indica que los procesos de depuracin de la informacin sobre fecundidad
fueron adecuados (cuadros 19 y 20).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

30

Cuadro 18
Mujeres en edad frtil y con informacin sobre HNV, por base, segn grupos de edad
Censo 2005
Edad frtil
Con informacin sobre HNV
Grupos
de
Base cruda
Base final
Base cruda
Base final
edad
PorcenPorcenPorcenPorcenRecuento
Recuento
Recuento
(aos) Recuento
taje
taje
taje
taje
Total
11 103 599 100,00 11 156 720 100,00 10 732 937 100,00 10 785 629 100,00
15-19
1 947 924
17,54
1 951 871
17,50
1 874 340
17,46
1 882 597
17,50
1 853 700
16,62
1 784 699
16,63
1 792 846
16,60
20-14
1 846 253
16,63
1 686 368
15,12
1 624 826
15,14
1 633 125
15,10
25-29
1 677 759
15,11
1 513 679
13,57
1 455 849
13,56
1 463 496
13,60
30-34
1 505 261
13,56
1 524 366
13,66
1 464 949
13,65
1 472 445
13,70
35-39
1 515 083
13,64
1 425 452
12,78
1 375 645
12,82
1 381 815
12,80
40-44
1 417 493
12,77
1 201 284
10,77
1 152 629
10,74
1 159 305
10,70
45-49
1 193 826
10,75
Fuente: DANE Censo General 2005

Cuadro 19
Mujeres en edad frtil, por caractersticas de fecundidad y base, segn grupos de edad
Censo 2005
Con hijos nacidos vivos
Sin hijos nacidos vivos
Grupos
Cruda
Final
Cruda
Final
de
edad
PorcenPorcenPorcenPorcenRecuento
Recuento
Recuento
(aos) Recuento
taje
taje
taje
taje
Total
15-19
20-14
25-29
30-34
35-39
40-44
45-49

7 029 075
277 969
875 193
1 144 248
1 207 763
1 279 603
1 219 605
1 024 694

100,0
4,0
12,5
16,3
17,2
18,2
17,4
14,6

7 063 115
279 588
879 512
1 149 943
1 213 782
1 285 716
1 224 638
1 029 936

100,0
4,0
12,5
16,3
17,2
18,2
17,3
14,6

3 703 862
1 596 371
909 506
480 578
248 086
185 346
156 040
127 935

100,0
43,1
24,6
13,0
6,7
5,0
4,2
3,5

3 722 514
1 603 009
913 334
483 182
249 714
186 729
157 177
129 369

100,0
43,1
24,5
13,0
6,7
5,0
4,2
3,5

Fuente: DANE Censo General 2005

Cuadro 20
ltimo HNV por base, segn ao y mes de nacimiento
Censo 2005
Cruda
Final
Fecha ltimo
HNV
Recuento Porcentaje
Recuento Porcentaje
Ao de nacimiento ltimo HNV

2000 o antes
2001
2002
2003
2004
2005
Total
Sistema
Total

4 189 328
461 768
492 277
559 569
640 271
656 100
6 999 313
29 762
7 029 075

59,6
6,6
7,0
8,0
9,1
9,3
99,6
0,4
100,0

4 204 479
463 621
494 436
562 229
643 320
659 840
7 027 925
35 190
7 063 115

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

59,5
6,6
7,0
8,0
9,1
9,3
99,5
0,5
100,0

31

Cuadro 20 (conclusin)
ltimo HNV por base, segn ao y mes de nacimiento
Censo 2005
Cruda
Final
Fecha ltimo
HNV
Recuento Porcentaje
Recuento Porcentaje
Mes de nacimiento ltimo HNV

Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
Total
Sistema
Total

565 034
509 186
566 680
555 251
584 206
572 036
597 597
614 730
639 626
620 968
587 369
592 104
7 011 042
24 288
7 029 075

8,0
7,2
8,1
7,9
8,3
8,1
8,5
8,7
9,1
8,8
8,4
8,4
99,7
0,3
100,0

565 764
510 061
567 904
556 575
585 277
573 112
598 700
616 004
640 431
622 682
588 581
593 171
7 018 262
44 853
7 063 115

8,0
7,2
8,0
7,9
8,3
8,1
8,5
8,7
9,1
8,8
8,3
8,4
99,4
0,6
100,0

Fuente: DANE Censo General 2005

Coherencia interna de la informacin y con fuentes externas: el procesamiento de las


bases de microdatos cruda y final permite obtener dos indicadores de fecundidad que resumen la coherencia de la informacin: uno es la paridez media acumulada por edades simples y el otro, la tasa global de fecundidad. Es preciso sealar que el objetivo del anlisis no
es el de establecer estimativos ajustados del indicador, por lo que los controles llevados a
cabo cuidan nicamente que el numerador tenga correspondencia con el denominador.
La paridez refleja el nmero medio de hijos tenidos por las mujeres en las distintas etapas
de su vida reproductiva. La comparacin con los resultados de la ltima Encuesta
Nacional de Demografa y Salud ENDS 2005, indican que la correspondencia entre una
y otra fuente es bastante alta hasta los 28 aos y despus de esta edad se presentan
variaciones, y siempre es ms alta la paridez que se deriva de la ENDS (grfico 8).
La Tasa Global de Fecundidad TGF8 es uno de los indicadores que brinda el mayor
conocimiento sobre los niveles y variacin en el tiempo. La TGF observada en el Censo, sin
ningn ajuste, de 0,2 hijos fue inferior a la que entrega la ENDS, aunque la informacin de
esta ltima corresponde al promedio de los tres aos anteriores a la encuesta. La diferencia
puede considerarse como no significativa, pero eventualmente altera el patrn de la
fecundidad visto a travs de las tasas especficas (cuadro 21).
La fecundidad, segn el Censo 2005, es inferior en los grupos de edad entre 15 y 29
aos, pero similar a partir de los 30 aos (grfico 9).
8

Nmero promedio de hijos que una mujer habra tenido al final de sus aos reproductivos, si la misma se
hubiera ajustado a la tasa de fecundidad por edad especfica, durante cada ao de su vida reproductiva
(Population Reference Bureau, 2003).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

32

Grfico 8
Paridez acumulada, por edades simples, segn fuente de informacin
2005
4
4

Paridez

3
3
2
2
Censo

ENDS

1
0
15

17

19

21

23

25

27

29

31

33

35

37

39

41

43

45

47

49

Edad
Fuente: Censo General 2005 y ENDS 2005

Cuadro 21
Tasas especficas y tasa global de fecundidad, por fuente,
segn grupos de edad
2005
Tasas especficas
Grupos de
Mujeres
HNV
edad (aos)
Censo 2005 ENDS 2005*
15-19
1 879 015
130 291
69,0
90,0
20-24
1 786 823
216 162
121,0
132,0
25-29
1 627 021
168 544
104,0
116,0
30-34
1 457 948
111 698
77,0
77,0
35-39
1 467 115
65 566
45,0
46,0
40-44
1 377 367
21 940
16,0
15,0
45-49
1 155 150
2 764
2,0
2,0
Tasa global
2,2
2,4
Fuente: Profamilia, Encuestas de Demografa y Salud, y DANE
*Comprende los tres aos anteriores a la encuesta

Grfico 9
Tasas especficas de fecundidad, por grupos de edad, segn fuente
2005
140
120
Censo

Tasa

100

ENDS

80
60
40
20
0
15-19

20-24

25-29

30-34
35-39
Grupos de edad

40-44

45-49

Fuente: Censo General 2005 y ENDS 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

33

A pesar de la coherencia entre los resultados que se derivan de las dos fuentes, es preciso
reconocer que la informacin sobre fecundidad puede tener limitaciones, tales como:

Ni el DMC, ni los formularios permitan captar los nacimientos ocurridos en 2006.


Presumiblemente, algunos fueron incorporados en aos anteriores, pero otros
definitivamente quedaron sin ser consignados.

De las mujeres con informacin vlida sobre HNV, una cuarta parte fue censada en el
ao 2006 (cuadro 22).
Cuadro 22
Mujeres en edad reproductiva,
segn ao del Censo 2005
Aos

Frecuencia

Porcentaje

Total

10 785 629

100,0

2005

8 083 950

75,0

2006

2 701 679

25,0

Fuente: DANE Censo General 2005

La informacin de las TGF departamentales no permite hacer inferencia sobre el


eventual impacto de departamento. Las mujeres censadas en 2006 varan desde
ninguna, como en Bogot, D.C., hasta el 100%, como en Caquet o Sucre; no
obstante, en ninguno se presentan evidencias sobre el impacto que pueda tener sobre
la TGF, el no haber consignado los hijos nacidos en el ao 2006 (cuadro 23):
Cuadro 23
Porcentaje de mujeres en edad frtil y TGF, segn departamento
2005-2006
Ao Censo 2005
Departamento
Mujeres
TGF
2005 (%) 2006 (%)
Total
10 785 629
75,0
25,0
2,2
Antioquia
1 484 749
73,9
26,1
2,0
Atlntico
580 981
98,1
1,9
2,2
Bogot, D.C.
1 918 965
100,0
0,0
1,8
Bolvar
459 052
75,3
24,7
2,5
Boyac
291 373
66,9
33,1
2,4
Caldas
236 532
79,3
20,7
1,9
Caquet
74 759
0,0
100,0
2,6
Cauca
285 141
46,1
53,9
2,3
Cesar
220 635
80,4
19,6
2,9
Crdoba
362 904
0,0
100,0
2,7
Cundinamarca
556 111
79,4
20,6
2,2
Choc
85 926
0,0
100,0
3,0
Huila
244 277
59,6
40,4
2,6
La Guajira
136 317
100,0
0,0
3,1
Magdalena
276 059
76,7
23,3
3,0
Meta
181 692
70,5
29,5
2,4
Nario
359 766
38,8
61,2
2,2

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

34

Cuadro 23 (conclusin)
Porcentaje de mujeres en edad frtil y TGF, segn departamento
2005-2006
Ao Censo 2005
Departamento
Mujeres
TGF
2005 (%) 2006 (%)
Norte de Santander
Quindo
Risaralda
Santander
Sucre
Tolima
Valle del Cauca
Arauca
Casanare
Putumayo
Archipilago de
San Andrs,
Providencia y
Santa Catalina
Amazonas
Guaina
Guaviare
Vaups
Vichada

315 800
138 616
232 386
513 490
186 607
319 557
1 110 305
35 572
70 081
55 220

81,7
100,0
93,5
79,8
0,0
72,9
88,6
0,0
0,0
0,0

18,3
0,0
6,5
20,2
100,0
27,1
11,4
100,0
100,0
100,0

2,3
1,7
1,8
2,0
2,6
2,4
1,8
2,4
2,6
2,2

16 016
10 470
4 237
11 399
3 102
7 532

100,0
0,0
0,0
0,0
0,0
0,0

0,0
100,0
100,0
100,0
100,0
100,0

2,2
3,3
3,1
2,5
3,6
3,6

Fuente: DANE Censo General 2005

Aunque nicamente el 25% de las mujeres en edad frtil fue censado en 2006, el
porcentaje de municipios que las alberga es del 70% del total (775) (cuadro 24). No
obstante, tampoco puede inferirse que el valor de las TGF que se observa en cada uno
de ellos pueda estar determinado por la ausencia de respuesta correcta de los nacidos
en 2006.
Cuadro 24
Municipios, por ao de censo, segn rango de la TGF
2005-2006
Censados 2005
Censados 2006
Rango TGF
Total Porcentaje
Total Porcentaje
Menor a 1,5
3
0,9
21
2,7
1,5 - <2,0
62
18,3
43
5,5
2,0 - <2,2
52
15,3
59
7,6
2,2 - <2,5
77
22,7
146
18,8
2,5 - <3,0
89
26,3
218
28,1
3,0 - <4,0
54
15,9
238
30,7
4,0 y ms
2
0,6
50
6,5
Total
339
100,0
775
100,0
Fuente: DANE Censo General 2005

Aunque esta limitante complementa y explica la anterior, puede sealarse que existe
subregistro diferencial en las preguntas de fecundidad, en detrimento del numerador;

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

35

as, por ejemplo, hijos menores de un ao declarados en las preguntas relacionadas con
la edad, por una u otra razn, no aparecen reportados ni en la relacionada con la tenencia de hijos en su vida reproductiva, ni tampoco en la fecha del ltimo hijo nacido vivo.
La poblacin menor de un ao en el Censo 2005 corresponde a los nacimientos ocurridos
en el ao anterior al Censo 2005, descontadas las defunciones infantiles correspondientes
a estos nacimientos.
En este marco, la poblacin en edad 0 debe ser menor a los nacimientos ocurridos en el
perodo. En el Censo 2005, esto no ocurre, el nmero de ltimos hijos nacidos vivos en el
ao anterior a la fecha censal (incluidos los de la poblacin entre 10 y 14 aos) es de
720.044, mientras que la poblacin en edad 0, an teniendo en consideracin la
sobrestimacin que present en el anlisis de la variable edad, supera los 800 000; de
hecho, el nmero de nios menores de 5 aos supera, en cada edad simple, esta misma
cantidad de personas (cuadros 25 y 26).
Cuadro 25
Mujeres entre 10 y 49 aos con y sin hijos nacidos vivos en el ltimo ao
Concepto
Total
Sin HNV
Con HNV

Frecuencia
12 848 743
12 128 699
720 044

Porcentaje
100,0
94,4
5,6

Porcentaje
vlido
100,0
94,4
5,6

Porcentaje
acumulado
94,4
100,0

Fuente: DANE Censo General 2005

Cuadro 26
Diferencia relativa entre la poblacin menor de 5 aos y los ltimos HNV
0 aos
1 ao
2 aos
3 aos
4 aos
Poblacin
855 931
815 629
809 219
803 665
821 539
Diferencia %
15,9
11,7
11,0
10,4
12,4
Fuente: DANE Censo General 2005

Si un porcentaje significativo de este subregistro es producto de la no inclusin de nacidos


vivos en 2006, las implicaciones sobre las medidas de fecundidad, en especial a nivel
municipal, pueden ser significativas.
Fuente probable de error: el error se genera cuando las directivas del Censo 2005 no
esperaban que el perodo de recoleccin fuera ms all del ao 2005; sin embargo, una
vez que hubo la necesidad de extender el perodo de recoleccin a 2006, no se tomaron
las previsiones para que los DMC y los formularios en papel tomaran en consideracin los
eventos de fecundidad que ocurren en este ao.
Impacto sobre los resultados: para evaluar el eventual impacto que puede haber trado
consigo la no consideracin de los HNV tenidos por las mujeres en el ao 2006, se realiz
un ejercicio que se fundamenta en que los hijos sobrevivientes menores de un ao,
reportados por las mujeres en edad reproductiva, son una buena aproximacin a los hijos
nacidos que los originan (anexo A).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

36

Los principales resultados del ejercicio indican que:

El subregistro de los HNV en el ltimo ao existe, afecta en mayor medida a los hijos
de las mujeres censadas en 2006.

Las metodologas diseadas y utilizadas en censos y encuestas por muestreo para ajustar los indicadores de fecundidad, contribuiran a reducir los diferenciales observados.

El problema mencionado anteriormente, no es de la magnitud indicada. La informacin


puede utilizarse efectuando los ajustes recomendados para sta.

Recomendaciones
Para la utilizacin de la informacin: se sugiere profundizar en el eventual problema con el
fin de estimar con mayor precisin: primero, el subregistro de las variables que intervienen
en el clculo de las medidas de fecundidad; segundo, evaluar cmo afecta los estimativos
a los diferentes niveles de desagregacin geogrfica; y tercero, emitir recomendaciones
para la utilizacin de los datos.
Para futuros censos:

El diseo, alistamiento, ejecucin del Censo 2005 deben responder a tiempos previamente establecidos y que deben cumplirse estrictamente.

Las eventualidades surgidas durante el operativo de ninguna manera pueden ir en


contra de la integridad y calidad de la informacin, todas ellas deben ser contempladas
antes de la iniciacin del operativo y tener las alternativas de respuesta apropiadas.

2.1.8 Mortalidad
Comparacin base cruda y base final: el cuestionario de hogares suministra el nmero
de personas fallecidas en los ltimos doce meses (cuadro 27). La comparacin de la
estructura de las defunciones de la base cruda y la final no muestra alteraciones con el
proceso de depuracin de la informacin.
Coherencia interna de la informacin y con fuentes externa: la comparacin con las
defunciones consignadas en el sistema de estadsticas vitales, muestra que la informacin
censal presenta un elevado subregistro en la edad cero y despus de los sesenta aos de
edad. Las defunciones en los restantes grupos de edad presentan valor similar; es decir,
tendran subregistro parecido al de las estadsticas vitales (grfico 10).
Balance e impacto sobre los resultados: los resultados sobre la poblacin fallecida en
los ltimos doce meses no permiten realizar mediciones directas de la mortalidad. El
significativo subregistro de las defunciones de menores de un ao, limitan tambin el
estudio de las relaciones existentes entre la incidencia de la mortalidad y las caractersticas socioeconmicas de los hogares.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

37

Cuadro 27
Fallecidos en los ltimos doce meses, por base, segn
grupos de edad
Censo 2005
Cruda
Final
Grupos de
edad (aos) Frecuencia Porcentaje Frecuencia Porcentaje
100,0
Total
100,0
171 287
171 365
Sistema
0,0
,0
0
70
Total
100,0
100,0
171 435
171 287
0
3,4
3,4
5 749
5 753
1-4
2,2
2,2
3 704
3 704
1,0
5-9
1,0
1 767
1 768
10-14
1,0
1,0
1 717
1 717
2,9
15-19
2,9
4 994
4 997
4,6
20-24
4,6
7 942
7 948
4,1
25-29
4,0
6 940
6 943
30-34
3,7
3,7
6 289
6 285
3,8
35-39
3,8
6 524
6 527
40-44
3,8
3,8
6 506
6 503
4,1
45-49
4,1
7 044
7 049
50-54
4,8
4,9
8 312
8 308
5,0
55-59
5,0
8 560
8 563
60-64
6,6
6,6
11 322
11 315
7,5
65-69
7,5
12 822
12 830
70-74
9,2
9,3
15 853
15 848
9,7
75-79
9,7
16 572
16 576
80-84
9,2
9,2
15 718
15 713
13,4
85 y ms
13,4
22 980
22 990
Fuente: DANE Censo General 2005

Grfico 10
Defunciones, por grupos de edad, segn fuente de informacin
2005
30000

Defunciones

25000
20000
15000
10000
5000

Vitales
Censo
80-84

75-79

70-74

65-69

60-64

55-59

85 y ms

Grupos de edad

50-54

45-49

40-44

35-39

30-34

25-29

20-24

15-19

10-14

5-9

1-4

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

38

Recomendaciones: para la inclusin de esta pregunta en futuros censos se recomienda


evaluar la pertinencia de su incorporacin en la boleta o dispositivo de captura de la
informacin. Si la respuesta es positiva, debe preguntarse, adems, sobre la forma de
realizarla y su localizacin.
2.1.9 Migracin
La migracin tiene dos componentes: uno relacionado con la migracin interna (incluye
inmigrantes que vivan en otro pas), la cual se capta a travs del mdulo de personas; y
el segundo, correspondiente a la emigracin de colombianos al exterior investigada con el
mdulo de hogares.
Migracin interna
Comparacin base cruda y base final: la informacin sobre migracin interna comprende, a su vez, dos bloques: el primero relacionado con la residencia 5 aos antes del
Censo 2005, y el segundo, con la condicin de migracin durante los 5 aos anteriores a
la fecha censal.
Residencia 5 aos antes del Censo 2005: la comparacin de la base cruda con la base
final muestra que los procesos de depuracin no alteran la estructura por lugar de
residencia de las personas 5 aos antes de realizarse el Censo (cuadro 28).
Cuadro 28
Distribucin de la poblacin, segn lugar de residencia hace 5 aos
Censo 2005
Base cruda
Base final
Lugar de residencia
Frecuencia Porcentaje Frecuencia Porcentaje
No haba nacido
9,9
10,0
4 077 732
4 122 902
En este municipio
81,6
81,5
33 619 091
33 577 118
En otro municipio
6,5
6,5
2 671 569
2 666 142
En otro pas
0,2
0,2
80 561
78 931
Total
40 511 151
98,4
40 445 093
98,2
No sabe, no informa
1,8
1,8
725 900
729 760
Total
100,0
100,0
41 174 853
41 174 853
Fuente: DANE Censo General 2005

De igual forma, la distribucin de los migrantes intermunicipales de los ltimos cinco aos
no cambia al pasar de la base cruda a la final. En sntesis, los procesos de depuracin de
la informacin fueron adecuados.
Condicin de migracin durante los 5 aos anteriores a la fecha censal: para analizar la
coherencia de la informacin del segundo bloque, es necesario precisar a qu se hace
referencia; de ese modo se pueden identificar 6 grupos de poblacin claramente definidos:
1. Migrantes de los ltimos 5 aos, de un municipio a otro o de otro pas al municipio
donde fue censado, y que en el periodo cambiaron de residencia, al menos una vez,
dentro del municipio (cuadro 29).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

39

Cuadro 29
Migrantes intermunicipales ltimos 5 aos, por base, segn departamento
Censo 2005
Base cruda
Base final
Departamento
Recuento Porcentaje Recuento Porcentaje
Total
100,0 2 666 142
100,0
2 671 569
Antioquia
16,6
16,6
444 036
442 909
Atlntico
3,6
3,6
96 621
97 030
Bogot, D.C.
12,5
12,6
335 171
335 105
Bolvar
2,2
2,2
57 773
57 700
Boyac
2,7
2,8
73 307
73 409
Caldas
2,6
2,7
70 656
71 035
Caquet
1,2
1,2
31 068
30 929
Cauca
2,0
2,0
54 076
54 160
Cesar
1,7
1,7
46 708
46 565
Crdoba
1,9
1,9
50 298
50 171
Cundinamarca
9,6
9,6
256 432
257 055
Choc
1,1
1,1
28 890
28 107
Huila
2,5
2,5
66 264
66 062
La Guajira
0,9
0,8
23 482
21 601
Magdalena
1,8
1,8
47 783
47 688
Meta
3,5
3,5
92 920
92 583
Nario
2,0
2,0
52 944
52 424
Norte de Santander
2,7
2,7
71 132
70 961
Quindo
2,3
2,3
61 830
61 577
Risaralda
3,8
3,8
101 001
100 822
6,9
6,9
Santander
184 290
184 374
Sucre
0,9
0,9
24 777
24 757
Tolima
3,0
3,0
79 569
79 292
Valle del Cauca
9,2
9,2
245 998
246 009
Arauca
0,3
0,3
7 702
7 629
Casanare
1,0
1,0
27 741
27 736
Putumayo
1,0
0,9
25 845
25 268
Archipilago de San
Andrs, Providencia y
1 522
0,1
1 521
0,1
Santa Catalina
Amazonas
0,1
0,1
1 380
1 378
Guaina
0,0
0,0
1 101
1 094
Guaviare
0,2
0,2
4 767
4 728
Vaups
0,0
0,0
1 253
1 235
Vichada
0,1
0,1
3 232
3 228
Fuente: DANE Censo General 2005

2. Migrantes de los ltimos 5 aos de un municipios a otro o de otro pas al municipio


donde fue censado, y que en el periodo cambiaron de municipio de residencia, al menos
una vez.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

40

3. No migrantes de los ltimos 5 aos, pero que en el perodo cambiaron de residencia


dentro del municipio
4. No migrantes de los ltimos 5 aos, que en el perodo cambiaron de municipio de
residencia. Corresponde a los migrantes nacidos en el perodo.
5. Migrantes de los ltimos 5 aos que manifiestan no haber cambiado de residencia en
el perodo.
6. No migrantes que manifiestan no haber cambiado de lugar de residencia en el perodo.
La estructura por condicin de migracin no cambia significativamente entre la base cruda
y la final; sin embargo, en valores absolutos se presentan variaciones en las categoras
que pueden incidir en las estimaciones de migracin: (1) los migrantes de los ltimos 5
aos que manifiestan no haber cambiado de residencia en el perodo (281 346), pasan a
engrosar la categora 9 (no sabe, no responde); (2) los no migrantes que manifiestan no
haber cambiado de lugar de residencia en el perodo, se reducen en 290 682 personas,
entre la base cruda y la final; y (3) se incrementan en similar valor los migrantes que
cambiaron de municipio (cuadro 30).
Cuadro 30
Condicin de migracin en los ltimos 5 aos, por base
Censo 2005
Base cruda
Base final
Condicin de migracin
Recuento Porcentaje Recuento Porcentaje
No sabe, no responde
2,3
2,9
936 977
1 206 286
Migrante - cambi -mismo municipio
1,9
1,9
786 554
786 536
Migrante - cambi -otro municipio
4,1
4,7
1 671 238
1 945 667
No migrante - cambi -mismo municipio
14,9
15,0
6 153 161
6 176 005
No migrante - cambi -otro municipio
1,0
1,0
404 469
409 933
Migrante - no cambi
0,7
0,0
281 346
0
No migrante - no cambi
75,1 30 650 426
74,4
30 941 108
Total
100,0 41 174 853
100,0
41 174 853
Fuente: DANE Censo General 2005

En sntesis, se corrige la informacin de la pregunta 30: En dnde viva hace cinco


aos? Cuando la persona informa que viva en este municipio (cdigo 2), pero el
departamento o municipio de residencia hace 5 aos era diferente al departamento o
municipio donde fue censado, se considera como migrante y se le asigna el cdigo 3 y
pasan a formar parte de la categora 2 (migrantes de los ltimos 5 aos que en el periodo
cambiaron, al menos una vez, de municipio de residencia).
La composicin de la migracin por la principal causa del movimiento permanece al pasar
de la base cruda a la final. Los procesos de depuracin fueron adecuados (cuadro 31).
Coherencia con otras fuentes: la nica fuente externa de comparacin corresponde a
las estadsticas sobre desplazados suministrada por Accin Social de la Presidencia de la
Repblica, que informa que los desplazados para 2005 son 221 000; o la de ACNUR que
para el mismo ao, informa de 310 000 en esta condicin. Frente a estas cifras, la
informacin censal aparece subregistrada, pero esto es inevitable, el desplazado, por

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

41

miedo, prefiere no declarar su condicin en censos y encuestas o, atribuyen la migracin


a razones familiares, ya que en un gran nmero de oportunidades, al efectuarse el desplazamiento, acuden a ellos para tener vivienda temporal (tabla 4).

Cuadro 31
Principal causa de la migracin, segn base
Censo 2005
Base cruda

Base final

Causa migracin
Total
Trabajo
Desastre natural
Violencia
Educacin
Salud
Razones familiares
Otra razn
No responde

Recuento

Porcentaje

Recuento

Porcentaje

9 389 940
1 420 547
107 629
310 672
314 338
140 828
4 465 184
2 284 724
346 018

100,0
15,1
1,1
3,3
3,3
1,5
47,6
24,3
3,7

9 691 488
1 510 013
203 661
406 202
415 055
244 970
4 563 875
2 287 730
59 982

100,0
15,6
2,1
4,2
4,3
2,5
47,1
23,6
0,6

Fuente: DANE Censo General 2005

Tabla 4
Desplazados, segn fuente
2001 - 2005
Fuente
Accin Social
Acnur

2001

2002

2003

2004

2005

170 393

323 461

381 468

194 400

221 681
310 387

Fuente: Accin Social, Registro nico de Poblacin desplazada (3/2/2007)

Emigracin al exterior
Otra variable de inters en los hogares es el total de emigrantes al exterior; la depuracin
de los datos no presenta variaciones entre la base cruda y la base final.
En relacin con los emigrantes al exterior de toda la vida captados por el Censo 2005 son
muy bajos, frente a cualquier estimacin, lo cual limita la utilizacin de esta variable para
cuantificar o generar indicadores orientados a la explicacin de este proceso (cuadro 32).
Recomendaciones: para el manejo de la informacin sobre la migracin al exterior debe
tenerse en consideracin las restricciones que presenta. Los valores absolutos seguramente no reflejan la realidad de los flujos permanentes al exterior, pero la composicin por
pases de destino puede ser de alguna utilidad.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

42

Cuadro 32
Emigrantes permanentes al exterior, por base
Censo 2005
Base cruda
Emigrantes
por hogar
Hogares
Personas Porcentaje
Total
297 831
464 336
100,0
1
205 377
205 377
44,2
2
54 326
108 652
23,4
3
20 452
61 356
13,2
4
9 448
37 792
8,1
5
4 068
20 340
4,4
6
1 800
10 800
2,3
7
962
6 734
1,5
8
568
4 544
1,0
9
274
2 466
0,5
10
420
4 200
0,9
11
26
286
0,1
12
27
324
0,1
13
17
221
0,0
14
18
252
0,1
15
38
570
0,1
16
1
16
0,0
20
1
20
0,0
26
1
26
0,0
30
2
60
0,0
60
5
300
0,1

Hogares
296 060
203 863
54 086
20 321
9 448
4 071
1 827
972
586
281
433
40
46
20
21
45
0
0
0
0
0

Base final
Personas Porcentaje
462 679
100,0
203 863
44,1
108 172
23,4
60 963
13,2
37 792
8,2
20 355
4,4
10 962
2,4
6 804
1,5
4 688
1,0
2 529
0,5
4 330
0,9
440
0,1
552
0,1
260
0,1
294
0,1
675
0,1
0
0,0
0
0,0
0
0,0
0
0,0
0
0,0

Fuente: DANE Censo General 2005

2.2 Variables socioeconmicas


2.2.1 Educacin
Se han seleccionado 4 variables educativas que, en su conjunto, reflejan la consistencia y
calidad de la informacin censal: (1) analfabetismo (sabe leer y escribir); (2) asistencia
escolar; (3) nivel educativo; y (4) ltimo grado aprobado.
Analfabetismo
Comparacin base cruda y base final: para el total del pas, las diferencias entre los
valores relativos, tanto para alfabetos y analfabetas, son cercanas a 1 punto porcentual,
pero con un incremento en valores relativos de la poblacin de 3 aos o ms que
manifiesta no saber leer ni escribir (cuadro 33).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

43

Cuadro 33
Condicin de analfabetismo, por base
Censo 2005
Base cruda
Base final
Lee y escribe
Frecuencia Porcentaje Frecuencia Porcentaje
Total
38 656 788
100,00 38 694 074
100,00
0
38 376
0,10
0,00
0,00
S
32 317 948
83,60 32 797 134
84,76
No
5 573 131
14,40
5 880 677
15,20
Perdidos/No informa
727 333
1,90
16 263
0,04
Fuente: DANE Censo General 2005

Con el fin de profundizar en el anlisis se toma la tasa de analfabetismo para la poblacin


de 15 aos o ms como indicador de referencia; cuando se comparan los resultados de la
base cruda con la base final, las diferencias presentan similar patrn y magnitud que el
observado para la poblacin de 3 aos y ms; para el pas la tasa pasa del 8,9% al 9,6%,
producto del comportamiento de la zona urbana, en donde el indicador crece del 5,8% al
6,7%; mientras que los valores de la zona rural son similares.
A nivel departamental y por zona, las diferencias son ms notorias: en 15 departamentos
(17 zonas urbanas y 15 rurales) el analfabetismo crece, con un agravante, que ocurre tanto
en departamentos con problemas de recoleccin (Vaups, Vichada), como en departamentos en donde estos no se presentaron, as como en Bogot, D.C. (cuadro 34).
Cuadro 34
Tasas de analfabetismo por zona y base, segn departamento
2005
Urbano
Rural
Departamento
Cruda
Final
Cruda
Final
Total
5,8
6,7
20
19,9
Antioquia
5,2
7,2
17,4
16,8
Atlntico
6,2
5,7
20,8
19,4
Bogot, D.C.
2,7
5,2
9
10,1
Bolvar
9,9
10,6
26,8
25,9
Boyac
5,3
5,6
17,5
16,8
Caldas
5,3
4,9
13,5
13,3
Caquet
9,7
12,9
15,1
19
Cauca
7,2
6,2
18,1
17,8
Cesar
11,1
10,5
29,3
29,3
Crdoba
11,6
10,6
27,7
26,6
Cundinamarca
4,4
5,3
11,9
12,1
Choc
12,4
14,3
31,2
37,8
Huila
7,1
7,4
14,6
14,6
La Guajira
8,7
15,8
56,6
61,4
Magdalena
10,7
10,4
27,1
27,1
Meta
6,1
6,3
13,1
14,6
Nario
7,5
8
19,8
19,4
Norte de
Santander
7,8
7,3
23,3
23,5

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

Total
Cruda
8,9
7,7
6,9
2,7
13,5
11,1
7,5
11,4
13,4
16
19,2
7
20,5
10
29,9
15,5
7,4
13,9

Final
9,6
9,2
6,3
5,2
13,9
10,9
7,1
14,8
12,9
15,5
18,2
7,7
24,2
10,2
35,6
15,3
7,8
13,9

10,9

10,6

44

Cuadro 34 (conclusin)
Tasas de analfabetismo por zona y base, segn departamento
2005
Urbano
Rural
Departamento
Cruda
Final
Cruda
Final
Quindo
6,3
5,5
11,2
10,5
Risaralda
5,3
4,4
14,6
13,9
Santander
5,2
4,7
16,9
15,9
Sucre
14,7
13,4
30,7
29,7
Tolima
7,3
7,6
18,9
18,3
Valle del Cauca
4,9
4,5
11,8
11,9
Arauca
8,5
11,8
18,6
21,5
Casanare
7
6,1
15
15,8
Putumayo
6,8
8,7
12
14,5
Archipilago de
San Andrs,
Providencia y
Santa Catalina
2,4
1,4
2,3
1,5
Amazonas
4,9
4,7
16,6
19,7
Guaina
14,2
12,7
24,1
26,3
Guaviare
7,9
20,8
15,5
19,3
Vaups
5,5
24,5
24,5
29,7
Vichada
7,4
17,9
24
29,2

Total
Cruda
7
7,3
8,2
20,3
10,9
5,8
9,7
9,3
9,2

Final
6,1
6,4
7,5
19,1
10,9
5,4
12,9
9
11,4

2,4
9,8
18,1
9,5
10,3
16,7

1,5
11
18,2
20,5
25,8
24,2

Fuente: DANE Censo General 2005

Coherencia de la informacin con otras fuentes: cuando se comparan con los


resultados finales de los dos ltimos censos, se puede concluir en periodo intercensal,
que no hubo ningn avance en la lucha contra el analfabetismo: el 9,5% en 1993 vs. el
9,6% en 2005. Peor an, no existe ninguna explicacin vlida que permita justificar que
Bogot, D.C., casi duplique su tasa de analfabetismo, o que Antioquia la increment en
1,6 puntos porcentuales (cuadro 35).
Cuadro 35
Tasas de analfabetismo por departamento, segn fuente
Censo 1993 y Censo 2005
Urbano
Rural
Departamento
Censo
Final
Censo
Final
1993
2005
1993
2005
Total
5,6
6,7
20,0
19,9
Antioquia
4,5
7,2
16,7
16,8
Atlntico
5,3
5,7
19,0
19,4
Bogot, D.C.
2,4
5,2
9,0
10,1
Bolvar
8,8
10,6
26,6
25,9
Boyac
5,7
5,6
17,3
16,8
Caldas
5,1
4,9
11,8
13,3
Caquet
9,3
12,9
15,6
19,0
Cauca
6,6
6,2
20,2
17,8
Cesar
11,4
10,5
26,9
29,3
Crdoba
12,7
10,6
31,5
26,6

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

Total
Censo
Final
1993
2005
9,5
9,6
7,6
9,2
6,1
6,3
2,5
5,2
14,0
13,9
12,4
10,9
7,4
7,1
12,6
14,8
14,9
12,9
16,9
15,5
22,1
18,2

45

Cuadro 35 (conclusin)
Tasas de analfabetismo por departamento, segn fuente
Censo 1993 y Censo 2005
Urbano
Rural
Departamento
Censo
Final
Censo
Final
1993
2005
1993
2005
Cundinamarca
4,9
5,3
13,7
12,1
Choc
12,5
14,3
34,6
37,8
Huila
8,0
7,4
15,4
14,6
La Guajira
10,6
15,8
51,8
61,4
Magdalena
9,9
10,4
26,6
27,1
Meta
6,1
6,3
14,6
14,6
Nario
7,7
8,0
21,1
19,4
Norte de Santander
8,1
7,3
26,3
23,5
Quindo
6,5
5,5
11,7
10,5
Risaralda
4,8
4,4
12,7
13,9
Santander
5,6
4,7
20,6
15,9
Sucre
18,1
13,4
35,6
29,7
Tolima
7,2
7,6
18,2
18,3
Valle del Cauca
4,3
4,5
12,3
11,9
Arauca
8,6
11,8
18,4
21,5
Casanare
7,1
6,1
16,1
15,8
Putumayo
6,9
8,7
14,4
14,5
Archipilago de San Andrs,
Providencia y Santa Catalina
1,5
1,4
1,7
1,5
Amazonas
6,0
4,7
17,4
19,7
Guaina
10,3
12,7
20,9
26,3
Guaviare
7,5
20,8
12,8
19,3
Vaups
5,3
24,5
17,0
29,7
Vichada
10,1
17,9
18,8
29,2

Total
Censo
Final
1993
2005
8,9
7,7
25,5
24,2
10,8
10,2
24,4
35,6
15,6
15,3
9,1
7,8
15,2
13,9
13,0
10,6
7,3
6,1
6,7
6,4
10,0
7,5
23,6
19,1
11,3
10,9
5,4
5,4
12,0
12,9
11,1
9,0
11,7
11,4
1,6
11,2
17,5
10,8
14,0
16,5

1,5
11,0
18,2
20,5
25,8
24,2

Fuente: DANE Censo General 2005

En forma similar, las tasa de analfabetismo para la poblacin de 15 aos o ms que arroja
el Censo, difiere significativamente de las que suministran las encuestas. De acuerdo con
estas ltimas, en el perodo 2003-2005, la tasa de analfabetismo vendra en descenso, en
particular por el comportamiento observado en la zona rural. Los tasas producto del
Censo 2005, para el total del pas, superan por ms de 2 puntos porcentuales a los de la
Encuesta de Hogares 2005; esta diferencia es similar en la zona urbana, pero cercana a
los 5 puntos en la zona rural (grfico 11 y cuadro 36).
Cuadro 36
Tasas de analfabetismo, por fuente, segn zona
Calidad de Vida
Censo 1993
2003
Zona
Recuento Media
Recuento Media

Recuento

Total
21 490 969
Urbano 15 714 183
Rural
5 776 716

30 929 789
23 277 377
7 652 412

9,5
5,6
20,0

29 905 467
22 672 889
7 232 577

7,6
4,5
17,4

EH 2005

Censo 2005

Media
7,2
4,6
15,1

Recuento
28 452 386
22 109 222
6 343 164

Media
9,6
6,7
19,9

Fuente: DANE Censo General 2005- ECV-EH

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

46

Grfico 11
Tasas de analfabetismo, por zonas, segn fuentes
20
18
16
14
Tasa

12
Censo 1993
10

Censo 2005

ECV 2003

EH 2005

4
2
0
Urbano

Rural

Total

Zona
Fuente: DANE Censo General 2005- ECV-EH

La comparacin de las tasas que arroja el Censo 2005 con las suministradas por el Censo
1993 y las de otras fuentes, evidencia que el probable error se genera al pasar de la base
cruda a la base ampliada. Los resultados a nivel municipal permiten presumir que el 27%
de ellos incrementa su nivel de analfabetismo, algunos con incrementos que de ninguna
forma son explicables y que superan los 10 puntos porcentuales (cuadros 37 y tabla 5).
Cuadro 37
Cantidad de municipios que experimentan cambios en la tasa
de analfabetismo, al pasar de la base cruda a la ampliada
Censo 2005
Incremento o reduccin
Ms de 10
5 a 10
2a5
Ms de 0 a 2
Total positivos
0 a -1
-1 a -2
-2 y Ms
Total negativos
Total municipios

Recuento

Porcentaje

27
55
79
142
303
325
318
169
812
1 115

2,4
4,9
7,1
12,7
27,2
29,1
28,5
15,2
72,8
100,0

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

47

Tabla 5
Municipios con incremento en la tasas
de analfabetismo superior a 10 puntos
porcentuales
Censo 2005
Tasa de
Municipios
analfabetismo
Argelia
67,9
El Retorno
50,8
Mapiripn
29,8
Lpez de Micay
26,3
Manaure
26,2
Calamar
24,3
Puerto Concordia
23,0
Arauquita
19,3
Viga del Fuerte
18,3
Medio Atrato
17,4
Mit
17,1
Bagad
15,8
Carmen de Atrato
15,5
La Primavera
15,3
Chivat
14,1
Montecristo
13,7
Carmen del Darin
11,8
La Vega
11,5
Recetor
11,4
Susa
11,1
Nimaima
11,0
Puerto Leguzamo
11,0
La Uribe
10,4
Algeciras
10,4
Cantn de San Pablo
10,2
Venadillo
10,2
Medio San Juan
10,1
Fuente: DANE Censo General 2005

El problema adquiere mayor relevancia cuando observamos que entre los municipios que
incrementan la tasa de analfabetismo estn ciudades como Bogot, Medelln y Cartagena
(tabla 6).
Con el propsito de enfocar el problema, se seleccionan las comunas y localidades de
Medelln y Bogot, D.C.. En la primera de las ciudades los problemas son ms notorios en
las comunas 10, 11, 12 y 15, en los que las tasas de analfabetismo pasan de cerca del 2%
en la base cruda del Censo 2005, a valores cercanos o que superan el 10% en la base final
(grfico 12). En la segunda, en la localidad de Barrios Unidos (12) la tasa pasa de menos
del 2% en la base cruda a ms del 19% en la base final; el problema tambin es serio en las
localidades 14 y 17, en donde los incrementos superan los 8 puntos porcentuales.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

48

Tabla 6
Capitales que incrementan la tasas de analfabetismo
al pasar de la base cruda a la base final
Censo 2005
Base cruda
Base final
Capitales
Recuento
Tasa
Recuento
Tasa
Medelln
4,23
7,58
1 658 175
1 655 878
Bogot, D.C. 4 936 833
2,68 4 946 310
5,24
Cartagena
5,83
7,12
628 252
628 477
Tunja
3,78
4,33
106 007
106 143
Florencia
8,31
12,56
85 944
86 137
Quibd
11,50
12,05
69 302
69 591
Riohacha
14,50
22,63
105 996
105 763
Santa Marta
5,90
6,32
279 934
279 867
Pasto
5,44
5,94
272 806
272 960
Ibagu
5,06
5,69
349 577
349 733
Arauca
8,16
11,06
42 291
42 435
San Jose del
Guaviare
23 532
9,01
23 679
14,95
Mit
9,04
26,17
10 343
10 371
Puerto
Carreo
7 371
11,84
7 432
13,59
Fuente: DANE Censo General 2005

Grfico 12
Tasas de analfabetismo en Medelln y Bogot, segn base
Censo 2005
Medelln. Tasas de analfabetismo por comuna, segn base
14
12

Tasa %

10
8
6
4

5099

5016

5015

5014

5013

5012

5011

5010

5009

5008

5007

5006

5005

5004

5003

5002

5001

Comuna

Cruda
Final

11020

11019

11018

11017

11016

11015

11014

11013

11012

11011

11010

11009

11008

11007

11006

11005

11004

11003

11002

20
18
16
14
12
10
8
6
4
2
0

11001

Tasas %

Bogot. Tasas de analfabetismo por loclaidad, segn base

Localidad

Cruda
Final

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

49

Fuente probable de error: las distorsiones se generan cuando existe valor en blanco o
nulo (missing) en la variable alfabetismo (sabe leer y escribir, pregunta 41) y
simultneamente el nivel aprobado es missing (cdigo 13, pregunta 44); los registros
con estas caractersticas son convertidos a analfabetas en el proceso de imputacin.
Por definicin operacional, este tipo de situacin nicamente poda darse en la
informacin capturada en papel; el dispositivo nicamente permita que en la pregunta 41
los valores fueran 1 o 2; de otra forma no dejaba continuar con la encuesta. De darse esta
situacin se esperara cierta regularidad en el comportamiento de los valores missing en
relacin con los valores vlidos y con la aplicacin o no de papel para la recoleccin de la
informacin; sin embargo, esto no ocurre:

El porcentaje de valores missing difiere significativamente en las 37 localidades de


Bogot, D.C.: 15 presentan valores inferiores al 2%; 13, entre el 2% y menos del 5%;
5, entre el 5% y menos del 10%; y 4, con valores superiores al 10% (grfico 13 y
cuadro 38).

El porcentaje de valores perdidos est directamente asociado al valor que adoptan las
localidades en la base final.

Grfico 13
Tasas de analfabetismo en Bogot, por localidad, segn base
y porcentaje de valores missing
Censo 2005
g
25
Perdidos
20

Cruda

Tasa %

Final
15

10

Total

1120

1119

1118

1117

1116

1115

1114

1113

1112

1111

1110

1109

1108

1107

1106

1105

1104

1103

1102

599

1101

516

515

514

513

512

511

510

509

508

507

506

505

504

503

502

501

comuna/localidad

Fuente: DANE Censo General 2005

Los valores missing, con excepcin de 741, fueron grabados en papel y luego transcritos
a los DMC, lo cual permite formular 4 hiptesis de necesaria demostracin:
1. No existen elementos que expliquen la enorme variacin en los porcentajes de valores
missing entre localidad y localidad.
2. La existencia de valores missing en analfabetismo y nivel son los que determinan el
valor de la tasa final de analfabetismo.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

50

3. Presuntamente, un gran nmero de encuestadores no diligenci la informacin


educativa, y por tanto, al transcribirla a la DMC se convierten en valores missing.
4. La informacin estuvo correctamente diligenciada, pero la trascripcin a los DMC fall
Las normas de imputacin aplicadas fueron correctas, ms no as su transformacin en el
algoritmo desarrollado para implantarlas.
Pruebas preliminares realizadas indican que el problema se origina con los formularios
transcritos a DMC, sin ningn proceso de validacin; y que la norma de imputacin es
correcta, pero la lgica del software desarrollado no lo es.
La conclusin es que la variable alfabetismo tiene problemas, con el agravante que est
interrelacionada con otras variables educativas que pueden ver afectada su calidad.
Cuadro 38
Bogot, D.C. Personas con valores missing en analfabetismo
y nivel educativo, por tipo de grabacin, segn localidad
Censo 2005
Tipo de grabacin
Localidad
DMC DIG-DMC Escner Reproceso
Total
734
155 756
6
1
Usaqun
79
258
6
0
Chapinero
1
303
0
0
Santaf
71
232
0
0
San Cristbal
11
4 444
0
0
Usme
25
586
0
0
Tunjuelito
29
3 626
0
0
Bosa
41
10 103
0
0
Kennedy
123
36 936
0
0
Fontibn
78
305
0
0
Engativ
44
28 530
0
0
Suba
112
14 702
0
1
Barrios Unidos
0
30 471
0
0
Teusaquillo
1
41
0
0
Los Mrtires
0
6 452
0
0
Antonio Nario
21
3 424
0
0
Puente Aranda
19
265
0
0
Candelaria
3
1 724
0
0
Rafael Uribe Uribe
42
6 652
0
0
Ciudad Bolvar
7
6 702
0
0
Sumapaz
27
0
0
0

Total
156 497
343
304
303
4 455
611
3 655
10 144
37 059
383
28 574
14 815
30 471
42
6 452
3 445
284
1 727
6 694
6 709
27

Fuente: DANE Censo General 2005

Recomendaciones:
De aplicacin inmediata:

Profundizar en el anlisis del problema: su magnitud y fuentes de error.

Analizar las distintas alternativas y valorar tcnicamente el costo de oportunidad para


implementarlas.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

51

Adoptar medidas correctivas de rpida aplicacin y que no generen serios


traumatismos al Censo 2005.

Una vez conocido el problema, las directivas de la Institucin promovieron la realizacin


de los estudios y acciones requeridas para corregir el problema (anexo B, respuesta
Institucional.
Para futuros censos:

No aplicar formularios en papel, de ser necesario, los procesos de capacitacin,


supervisin y control de calidad deben ser muy exigentes.

No transcribir los formularios en papel a DMC, se generan dos fuentes de error: el que
traen consigo los formularios y el que se genera en la trascripcin.

Correccin de la informacin y resultado final: la correccin de los problemas detectados implic:

La revisin del documento de normas, que no generan el resultado final observado.

Se revis el cdigo CSPRO que se implement, y se encontr un cambio de lgica de


las normas para el manejo de blancos.

Se actualiza la base depurada con los datos de la base cruda correspondientes a las
variables.

Se realiza el ajuste a la funcin que crea la variable auxiliar con el fin de garantizar el
funcionamiento adecuado de la imputacin en caliente del nivel y ao, en aquellos
casos que sean inconsistentes.

Realizacin de pruebas y conformacin de una nueva base despus de depurada la


informacin.

El ejercicio de correccin realizado fue el apropiado y la informacin resultante sobre el


alfabetismo de la poblacin es de calidad y puede utilizarse sin ningn tipo de correctivos
(anexo B).

Asistencia escolar
Comparacin base cruda, base final: a diferencia de lo encontrado para el analfabetismo,
la coherencia entre la base cruda y la base final es buena. Para el total de la asistencia
escolar, as como para los grupos de referencia de los niveles educativos (primaria,
secundaria y superior), las variaciones entre la informacin original y la final no supera 1
punto porcentual. A nivel departamental y para cada uno de los grupos de edad
seleccionados, los resultados entre una y otra base son igualmente coherentes (cuadro 39).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

52

Cuadro 39
Asistencia escolar, por base y grupo de edad, segn departamento
Censo 2005
Grupos de edad (aos)
Departamento
Base cruda
Base final
7 a 11 12 - 17 18 - 24 7 a 11 12 - 17 18 - 24
Total
91,0
76,9
27,1
92,0
77,8
27,4
Antioquia
90,9
75,6
27,3
91,8
76,4
27,6
Atlntico
89,7
81,0
29,5
90,6
81,9
29,8
Bogot, D.C.
94,0
85,5
36,1
94,9
86,4
36,5
Bolvar
90,2
79,3
27,7
91,1
80,1
28,0
Boyac
93,8
75,0
26,8
94,7
75,8
27,1
Caldas
91,8
75,3
28,8
92,7
76,1
29,1
Caquet
89,4
69,4
21,5
90,3
70,1
20,3
Cauca
89,8
65,8
21,0
90,9
66,9
21,4
Cesar
86,6
74,1
22,8
87,4
74,8
23,1
Crdoba
90,9
78,6
23,2
91,9
79,4
23,5
Cundinamarca
93,8
79,6
23,8
94,8
80,5
24,1
Choc
77,9
70,9
29,6
80,0
73,0
29,5
Huila
90,3
67,5
19,7
91,2
68,1
19,9
La Guajira
69,2
64,8
25,6
69,5
65,1
26,2
Magdalena
88,4
77,3
22,6
89,3
78,0
22,8
Meta
90,9
75,9
22,2
92,0
76,8
22,4
Nario
89,5
64,4
19,3
90,7
65,9
19,6
Norte de Santander
90,1
72,4
24,5
91,0
73,2
24,7
Quindo
91,0
78,7
26,7
91,9
79,5
27,0
Risaralda
90,6
76,4
25,1
91,5
77,2
25,4
Santander
92,3
74,8
28,8
93,3
75,6
29,2
Sucre
92,5
81,8
24,1
93,4
82,6
24,3
Tolima
89,0
73,6
22,9
89,9
74,4
23,1
Valle del Cauca
93,8
79,7
26,1
94,8
80,6
26,3
Arauca
92,3
77,3
18,4
93,6
78,3
18,7
Casanare
92,0
74,7
20,4
92,9
75,5
20,4
Putumayo
91,9
67,5
19,2
93,6
70,7
17,1
Archipilago de San Andrs,
Providencia y Santa Catalina
95,1
88,5
22,2
96,0
89,4
22,4
Amazonas
90,7
78,7
21,9
91,8
80,2
22,5
Guaina
83,7
77,0
31,1
85,2
79,0
33,1
Guaviare
90,7
76,4
17,3
91,7
77,0
16,6
Vaups
91,9
84,2
39,7
92,7
85,0
40,0
Vichada
74,8
57,3
15,0
76,5
59,6
16,0
Fuente: DANE Censo General 2005

Coherencia con otras fuentes: cuando se compara la asistencia escolar por grupos de
edad, que arroja el Censo 2005 y las encuestas tomadas como referencia, no se observa
un patrn definido; mientras que para el grupo 7 a 11 aos, la tasa de asistencia en la
Encuesta Continua de Hogares es del 97%, en la de Calidad de Vida y el Censo, es
cercana al 92%; el comportamiento del grupo 12 a 17 aos es similar, ms no en el de 18
a 24 aos, en el cual las mayores tasas son las del Censo (tabla 7).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

53

Tabla 7
Asistencia escolar, por fuente, segn grupos de edad
Grupos
ECV 2003
EH 2005
de edad
Recuento
Media
Recuento
Media
(aos)
7-11
4 866 706,92 92,80
4 884 851,17
96,70
12-17
5 420 058,62 76,20
5 243 379,67
81,20
18-24
5 445 457,35 24,70
5 441 950,33
25,10

Censo 2005
Recuento
4 243 559,00
4 903 234,00
4 924 408,00

Media
92,00
77,80
27,40

Fuente: DANE Censo General 2005- ECV-EH

La comparacin con el Censo 1993, a diferencia de lo que se observa con el analfabetismo,


muestra el patrn esperado de acuerdo con los logros que ha experimentado el pas en los
ltimos doce aos. En cada uno de los grupos de edad y en todos los departamentos, se
incrementa la asistencia escolar (grfico 14).
Grfico 14
Tasas de asistencia escolar, por grupos de edad, segn departamento
Censos 1993 y 2005
120
100

Tasa

80
60
40
20
7 a 11 93

An
tio
At qui
l a
nt
Bo ico
go
Bo t
l
Bo var
ya
C c
al
C das
aq
ue
C t
au
c
C a
C C esa
un
r
d i do r
na b
m a
ar
c
C a
ho
c
L a Hu
G il a
M ua
ag ji r
da a
le
na
M
et
N
N
.S a a
an ri
ta o
n
Q d er
u
R ind
is o
Sa ara
nt lda
an
de
Su r
c
To re
lim
a
Va
Ar lle
a
C
as uca
a
Pu na
r
Sa tum e
n ay
An o
Am d r
a z s
o
G nas
ua
G in
ua a
v
Va iare
up
Vi s
ch
ad
a
To
ta
l

7 a 11 05
12 a 17 93
12 a 17 05
18 a 4 93
18 a 24 05

Fuente: DANE Censo 1993- Censo General 2005

Fuente probable de error: no se evidencian errores en el tratamiento de esta variable.


Recomendaciones: no se formulan
Nivel educativo y grado aprobado
El proceso para resolver problemas de respuestas missing, invlidas o inconsistentes en la
informacin educativa, primero, imputa el nivel educativo y el grado alcanzado; y segndo,
con base en esta informacin, depura los datos sobre analfabetismo. En la medida en que
la traduccin de las normas al software presenta limitaciones, los indicadores que toman
como referencia las primeras variables, van a verse distorsionados. El principal de ellos son
los aos promedio de educacin que resumen el comportamiento de estas variables.
La primera comparacin no evidencia la incidencia del inadecuado tratamiento de las
variables educativas. En todos los departamentos los aos promedio de educacin son
similares en la base final que en la base cruda (grfico 15).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

54

Grfico 15
Poblacin de 15 aos y ms. Aos promedio de educacin, por departamento, segn base
Censo 2005
12,00
10,00
8,00
Cruda

6,00

Final

4,00
2,00

Total

Vaups

Vichada

Guaina

Guaviare

Amazonas

San Andrs

Casanare

Putumayo

Valle

Arauca

Sucre

Tolima

Santander

Quindo

Risaralda

N. Santander

Meta

Nario

Magdalena

Huila

La Guajira

Choc

Cundinamarca

Cesar

Crdoba

Cauca

Caldas

Caquet

Bolvar

Boyac

Bogot

Atlntico

Antioquia

0,00

Fuente: DANE Censo General 2005

A pesar de la similitud en la informacin, es necesario profundizar en el problema y


corregir el software de imputacin para despus analizar la coherencia interna y con
fuentes externas de las variables educativas.
Correccin de la informacin y resultado final: se esperaba que la revisin y
correccin de los programas para imputar la informacin educativa, trajeran consigo
variaciones en la escolaridad de la poblacin, pero esto no ocurri; una vez se homologan
numeradores y denominadores (los valores en blanco en el nivel educativo de la base
cruda, se convierten en 0 en la base imputada), la correspondencia en los niveles de
escolaridad es buena; los cambios entre la base cruda y las generadas posteriormente
(base con errores y base final) no son significativos (anexo B).
El ejercicio de correccin y comparacin no es intil; permite tener la certeza que la
informacin final es de buena calidad y utilizable sin restricciones.
2.2.2 Actividad en la semana previa al Censo
Comparacin base cruda y base final: de la comparacin entre estas bases surgen
varios hechos que ameritan profundizacin:

Al parecer a todos los valores perdidos (o a la mayor parte) observados en la base


cruda se les asigna cdigo cero en la base final.

No existe razn aparente por la cual la poblacin estudiante, en particular la menor


de 18 aos, pierde representatividad; mientras que la poblacin ocupada, la gana
(cuadro 40).

A pesar que se reconoce que la informacin directa (sin ajustes) de los censos no es la
ms apropiada para medir los indicadores de la fuerza de trabajo, la depuracin de los
datos cambia radicalmente el valor de ellos (tabla 8).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

55

Cuadro 40
Actividad en la semana anterior al Censo, por grupos de edad, segn base
Censo 2005
5-11 aos
12-17 aos
18 y ms aos
Actividad semana
anterior
Recuento Porcentaje
Recuento Porcentaje
Recuento
Porcentaje
Base cruda
Total
5 903 808
100,0
4 885 089
100,0
25 203 039
100,0
0
14 831
0,3
7 856
0,2
23 463
0,1
Trabaj
23 090
0,4
354 684
7,3
12 650 794
50,2
No trabaj, tena trabajo
12 298
0,2
19 594
0,4
305 433
1,2
Busc trabajo, haba
trabajado
1 028
0,0
26 260
0,5
872 407
3,5
Busc trabajo por
primera vez
2 664
0,0
25 540
0,5
179 304
0,7
Estudi, no trabaj, no
busc
4 492 070
76,1
3 281 217
67,2
1 211 015
4,8
Oficios del hogar
147 226
2,5
419 214
8,6
6 528 687
25,9
Incapacitado
22 689
0,4
21 768
0,4
446 572
1,8
Jubilado, rentista
2 863
0,0
2 150
0,0
739 610
2,9
Otra situacin
1 185 049
20,1
726 806
14,9
2 245 754
8,9

Total
0
Trabaj
No trabaj, tena trabajo
Busc trabajo, haba
trabajado
Busc trabajo por
primera vez
Estudi, no trabaj, no
busc
Oficios del hogar
Incapacitado
Jubilado, rentista
Otra situacin

6 052 950
164 389
95 995
12 323

Base final
100,0
4 994 283
2,7
115 404
1,6
401 838
0,2
19 636

100,0
2,3
8,0
0,4

26 021 637
814 036
12 691 353
305 722

100,0
3,1
48,8
1,2

1 025

0,0

26 224

0,5

872 266

3,4

2 595

0,0

25 014

0,5

176 883

0,7

4 421 652
147 148
22 689
0
1 185 134

73,0
2,4
0,4
0,0
19,6

3 239 324
418 221
21 764
0
726 858

64,9
8,4
0,4
0,0
14,6

1 200 833
6 525 065
446 853
739 571
2 249 055

4,6
25,1
1,7
2,8
8,6

Fuente: DANE Censo General 2005

Tabla 8
Tasas globales de participacin y de desempleo, por grupo de edad,
segn fuente
Censo 2005
5 - 11 aos
12 - 17 aos
18 y ms aos
Base
DesemDesemDesemTGP
TGP
TGP
pleo
pleo
pleo
Cruda
0,8
9,4
10,3
12,2
61,1
7,5
Final
2,4
3,2
11,4
10,8
61,2
7,5
Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

56

Fuente probable de error: indagaciones preliminares indican que a la poblacin que


manifestaba estar en cualquiera de las categoras ocupacionales (pregunta 49) y no
estuvieran ocupados, se les asignaba cdigo 1 (trabajando). Esto, de acuerdo con el flujo
de la informacin, no cubra a la poblacin inactiva (los remita a la pregunta 51).
Recomendaciones: las recomendaciones y acciones emprendidas son similares a las
planteadas para la informacin educativa:

Profundizar en el anlisis del problema: su magnitud y fuentes de error.

Adoptar medidas correctivas de rpida aplicacin y que no generen serios traumatismos al Censo 2005.

Correccin de la informacin y resultado final: el proceso para la correccin de la


informacin sobre la actividad en la semana previa al Censo, es similar al realizado con
los datos educativos:

Recuperacin de los registros originales contenidos en la base cruda.


Aplicacin correcta de las normas de imputacin.
Conformacin de la nueva base con informacin de los registros objeto de imputacin.

La correccin realizada permite asegurar que la informacin sobre la actividad realizada


por las personas en la semana anterior al Censo, no presenta problema y que puede
utilizarse en forma confiable. As mismo, los correctivos aplicados corrigen simultneamente la variable categora ocupacional, al reducir especialmente a la poblacin menor de
edad estudiante y antes clasificada como trabajadores familiares sin remuneracin.
2.2.3 Rama de actividad econmica
Coherencia de la informacin: los resultados sobre la rama de actividad econmica son
muy pobres. El DANE no debera presentarla en ninguno de sus resultados, ya que preguntas con niveles del 70% de no respuesta es de muy poco valor para los investigadores del
mercado de trabajo (cuadro 41).
Cuadro 41
Poblacin ocupada, por zona de residencia, segn actividad econmica
Censo 2005
Actividad econmica
Total general
No informa
Agricultura, ganadera, caza y silvicultura
Pesca
Explotacin de minas y canteras
Industrias manufactureras
Suministros de electricidad, gas y agua
Construccin
Comercio al por mayor y al por menor
Hoteles y restaurantes
Transporte, almacenamiento y comunicaciones

Total

Cabecera

13 214 721
8 560 679
1 349 710
29 368
42 801
429 344
13 297
268 595
915 604
123 671
317 246

10 575 861
7 347 092
273 539
11 235
19 780
382 566
12 177
215 408
849 791
112 111
290 082

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

Porcentaje
100,0
69,5
2,6
0,1
0,2
3,6
0,1
2,0
8,0
1,1
2,7

Resto
2 638 860
1 213 587
1 076 171
18 133
23 022
46 778
1 120
53 187
65 813
11 560
27 163

57

Porcentaje
100,0
46,0
40,8
0,7
0,9
1,8
0,0
2,0
2,5
0,4
1,0

Cuadro 41 (conclusin)
Poblacin ocupada, por zona de residencia, segn actividad econmica
Censo 2005
Actividad econmica
Intermediacin financiera
Actividades inmobiliarias, empresariales y de alquiler
Administracin pblica y defensa
Educacin
Servicios sociales y de salud
Otras actividades de servicios comunitarios
Hogares privados con servicio domstico
Organizaciones y rganos extraterritoriales

Total
53 276
282 163
124 327
249 348
165 685
145 202
143 824
581

Cabecera
52 274
263 640
115 346
222 694
154 078
135 010
118 481
558

Porcentaje
0,5
2,5
1,1
2,1
1,5
1,3
1,1
0,0

Resto
1 003
18 523
8 981
26 654
11 607
10 191
25 343
23

Fuente: DANE Censo General 2005

2.3 Variables de la vivienda y el hogar


2.3.1 Variables de la vivienda
Comparacin base cruda y base final: de las caractersticas de la vivienda se
seleccionan tres variables: tipo de vivienda, disponibilidad de servicios pblicos y
condicin de ocupacin. Las dos primeras se utilizan para visualizar los cambios en la
integridad de la informacin al pasar de la base cruda a la final; mientras que la tercera
permite efectuar algunos alcances sobre la cobertura censal (cuadro 42).
Cuadro 42
Distribucin de las viviendas, por base, segn tipo
Censo 2005
Base cruda
Base final
Tipo de vivienda
PorcenPorcenRecuento
Recuento
taje
taje
Total
10 390 785
100,0
10 390 207
100,0
Perdidos sistema
7 285
0,1
Total
10 383 500
99,9
0
20 292
0,2
Casa
7 106 464
68,4
7 135 521
68,7
Casa indgena
100 216
1,0
102 745
1,0
Apartamento
2 547 705
24,5
2 577 356
24,8
Tipo cuarto
563 765
5,4
535 948
5,2
Otro tipo
45 058
0,4
38 637
0,4
Fuente: DANE Censo General 2005

La distribucin de las viviendas segn tipo ni la tenencia de servicios pblicos experimentan


cambios en su estructura, al pasar de la base cruda a la base final (cuadro 43).
Coherencia con otras fuentes: la comparacin con el Censo 1993 muestra que el
perodo extendido de recoleccin y el esquema de revisitas mltiples para obtener el
mximo nmero de entrevistas completas, permiten reducir significativamente la prdida
de informacin; as, el 2,4% de viviendas ocupadas con personas ausentes observado en
el Censo 1993, desaparece en el Censo 2005.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

58

Porcentaje
0,0
0,7
0,3
1,0
0,4
0,4
1,0
0,0

Cuadro 43
Tenencia de servicios pblicos bsicos, por base, segn tipo
Censo 2005
Base cruda
Base final
Servicio
Recuento
Porcentaje
Recuento
Porcentaje
Energa elctrica

Total
No informa
Total
0
Tiene
No tiene
3
4

10 390 785
547 142
9 843 643
45 466
9 211 290
586 881
5
1

100,0
5,3
94,7
0,4
88,6
5,6
0,0
0,0

10 390 207
647 279

100,0
6,2

9 119 787
623 141

87,8
6,0

10 390 785
548 719
9 842 066
46 316
8 189 660
1 606 090

100,0
5,3
94,7
0,4
78,8
15,5

10 390 207
647 279

100,0
6,2

8 125 908
1 617 020

78,2
15,6

10 390 785
549 040
9 841 745
54 343
7 192 489
2 594 913

100,0
5,3
94,7
0,5
69,2
25,0

10 390 207
647 279

100,0
6,2

7 117 781
2 625 147

68,5
25,3

Acueducto

Total
No informa
Total
0
Tiene
No tiene
Alcantarillado

Total
No informa
Total
0
Tiene
No tiene

Fuente: DANE Censo General 2005

Si bien, para las zonas urbanas la evidencia parece ser incontrovertible, para la zona
rural, el panorama no es tan claro: (1) el censo rural por barrido se realiz en 1 019
municipios del pas, y permiti la recoleccin de la informacin censal de toda el rea
rural, mediante la visita a la totalidad de las veredas existentes en cada municipio. Para
cada uno de estos, se efectu de manera previa a la recoleccin, una ubicacin
aproximada de las viviendas en la cartografa rural, es decir, se visitaba casi que
exclusivamente las viviendas que se saba estaban ocupadas; (2) independiente del
perodo de recoleccin, la poblacin rural no se inmoviliza, o lo hace en menor medida
que la urbana, para atender la realizacin del Censo; y (3) en el rural disperso no se
efectuaron revisitas (cuadro 44).
Los tres factores mencionados permiten suponer que las viviendas ocupadas con personas
ausentes, encontradas en terreno, fueron clasificadas como desocupadas. As, mientras
que el porcentaje de viviendas ocupadas es el mismo en los dos censos, el correspondiente
a las desocupadas, en el perodo, se incrementa en 2,7 puntos porcentuales. De ser esto
as, la evidencia estara reflejando un subregistro de viviendas ocupadas rurales y, por
tanto, un problema de cobertura.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

59

Cuadro 44
Viviendas particulares, por rea, segn condicin de ocupacin
Censos 1993 y 2005
Cabecera
Resto
Condicin de ocupacin
Recuento Porcentaje Recuento Porcentaje

Total
Recuento Porcentaje

Censo 1993

Total
4 819 944
Ocupada, personas presentes 4 481 080
Ocupada, personas ausentes
103 999
Desocupada
234 865

100,0
93,0
2,2
4,9

Total
7 826 422
Ocupada, personas presentes 7 488 834
Ocupada, personas ausentes
603
Desocupada
336 985

100,0
95,7
0,0
4,3

2 104 001
1 845 092
62 126
196 783

100,0
87,7
3,0
9,4

6 923 945
6 326 172
166 125
431 648

4 819 944
4 481 080
103 999
234 865

100,0
87,9
0,0
12,1

10 390 207
9 742 928
876
646 403

7 826 422
7 488 834
603
336 985

Censo 2005

2 563 785
2 254 094
273
309 418

Fuente: DANE

Fuente probable de error: no se evidencian errores en el tratamiento de la informacin


sobre las caractersticas de la vivienda.
Recomendaciones: la informacin sobre las caractersticas de la vivienda puede utilizarse
en forma confiable.
2.3.2 Variables del hogar
Comparacin base cruda y base final: en trminos absolutos y relativos, la mayor parte
de los valores perdidos y algunos correspondientes a los tamaos que pierden
representatividad (2 y 3), se agregan a hogares con 6 y ms personas. No obstante, su
incidencia sobre el tamao medio del hogar es desestimable (3,8 personas en la base
cruda y 3,9 personas en la final) (cuadro 45).
Cuadro 45
Distribucin de los hogares, por base, segn tamao
Cruda
Final
Tamao
(personas
Frecuencia Porcentaje Frecuencia Porcentaje
por hogar)
Total general
Sistema
Total
1
2
3
4
5
6 y ms

10 735 948
314 529
10 421 419
1 161 792
1 640 526
2 155 316
2 215 093
1 533 002
1 715 690

100,0 10 570 899


2,9
0
97,1 10 570 899
10,8
1 176 558
15,3
1 604 082
20,1
2 099 506
20,6
2 173 801
14,3
1 580 188
16,0
1 936 764

100,0
0,0
100,0
11,1
15,2
19,9
20,6
14,9
18,3

Fuente: DANE Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

60

Coherencia de la informacin: lo que muestra la comparacin entre los resultados


censales y los de las encuestas cercanas a la fecha del empadronamiento, es que en el
Censo son relativamente mayores los hogares con una o dos personas, lo cual, lo que se
podra explicar, dado que las encuestas por muestreo no estn diseadas para captar
suficientemente ciertas especificidades, o estar indicando la existencia de subregistro al
interior de los hogares y que se produce cuando uno o ms de sus miembros no atienden
el llamado de inmovilizacin y no son declarados como residentes habituales del hogar
(grfico 16).
Grfico 16
Distribucin de los hogares, por tamao, segn fuente de informacin
25

Porcentaje

20
15
10
5
0
1

6y+

Personas por hogar

Censo
EH 2005
ECV 2003

Fuente: DANE Censo General 2005- ECV-EH

Fuente probable de error: no se evidencian errores en el tratamiento de la informacin


sobre las caractersticas del hogar.

RESUMEN
Balance del anlisis de la depuracin de la informacin
El objetivo central del ejercicio realizado era el de verificar que los procesos de correccin
de los datos incoherentes (consistencia interna) y la adicin de datos que no existen en el
cuestionario, pero que admiten que se formulen supuestos razonables al respecto
(imputacin), no alteraran en forma significativa el volumen, estructura y composicin de
la informacin producto del recuento censal.
La metodologa radic en determinar los cambios que experimenta la informacin entre la
base inicial (cruda) y la base resultado de todos los procesos de depuracin (final). De
igual forma, acorde con los resultados de otras fuentes de informacin (especialmente
censos anteriores y encuestas), se analiz la coherencia de los resultados del Censo
2005 para cada una de las variables seleccionadas para conformar la lnea de base.
No todas las variables fueron incluidas en la comparacin entre la base cruda y la final, se

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

61

seleccionaron aquellas de mayor relevancia en el anlisis demogrfico y socioeconmico,


as: (1) variables demogrficas : volumen y distribucin por clase, edad, sexo, parentesco,
estado conyugal, etnia, migracin, fecundidad, mortalidad; (2) variables educativas:
analfabetismo, asistencia escolar, aos promedio de educacin; (3) variables de la
actividad y participacin econmica: actividad la semana previa al censo y rama de
actividad econmica; (4) variables de la vivienda y el hogar: tipo de vivienda, condicin de
ocupacin y disponibilidad de servicios pblicos, tamao y composicin de los hogares y
emigrantes del hogar al exterior.
El balance general indica que, al igual que la mayora de los censos, el de 2005 presenta
errores producto de la mala informacin suministrada por el encuestado o el mal manejo
de los conceptos y los medios de recoleccin de la informacin, por parte del encuestador. Algunos de estos errores se corrigen en los procesos de depuracin de la informacin
(correccin de datos incoherentes y formulacin de supuestos razonables sobre el valor
de los datos), pero otros permanecen y deben ser tratados mediante metodologas
especialmente diseadas para dar coherencia a la informacin. En el Censo 2005 se
presentan estos errores, pero ninguno de ellos reviste la importancia que conduzca a
descalificar la calidad de la informacin censal.
En el Censo 2005 aparece otro tipo de errores generados por el manejo inadecuado de
algunos procesos o por una mala interpretacin y traduccin de las normas de imputacin
en algoritmos tiles para depurar la informacin. Una vez se detectan estos problemas los
programas se corrigen y se reprocesa la informacin. Los procesos realizados respetan la
integridad de la informacin y la lgica de los procesos de imputacin, por tanto, los
resultados de las variables tratadas son de calidad y dejan de ser una limitante para la
utilizacin de la informacin del Censo 2005.
A continuacin se presenta un resumen de los principales hallazgos del anlisis realizado:

Variables demogrficas
Distribucin espacial de la poblacin: tres desagregaciones geogrficas se tomaron
para el anlisis de la distribucin espacial de la poblacin: (1) distribucin de la poblacin
por clase; (2) los centros poblados; y (3) las reas geogrficas (AG). En la primera de
ellas, al comparar los resultados de la base cruda con la base final, se encontraron
pequeas variaciones en 73 municipios. Para corregir las desviaciones, el DANE llev a
cabo un ejercicio de restitucin de AG que asegura que la poblacin corregida es la que le
corresponde al municipio.
Pocos centros poblados y algunas AG existentes no aparecen consignados en la base
censal, varios factores podran contribuir a la explicacin de los faltantes (Centro
poblados: conversin en municipio, desaparicin, contado como parte del rural disperso;
reas geogrficas: la poblacin fue censada en otras AG); sin embargo, no puede
descartarse que exista un problema de no cobertura.
El anlisis de las tres desagregaciones geogrficas evidencia problemas de desactualizacin cartogrfica y eventualmente, problemas de organizacin del operativo. No obstante,
ninguna de ellas genera limitantes para la utilizacin confiable del Censo.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

62

Edad: la informacin sobre la edad es un buen ejemplo de cmo la utilizacin de los DMC
y el software (controles), mejoran la calidad de la informacin censal. Los ndices de
calidad analizados muestran que la informacin capturada en los DMC (95% del total) se
encuentra en los rangos de la informacin de buena calidad; cuando la captura es
cuestionario en papel (3% del total) y posteriormente grabada en DMC, la informacin an
se encuentra en los lmites de aceptabilidad; y cuando la recoleccin se realiza mediante
papel y luego se graba mediante escner (2%), es de calidad media.
De igual forma, la distribucin por edades simples del Censo 2005 es, en balance con la
que suministran los censos anteriores, significativamente mejor; ya no son tan marcadas
las distorsiones producto del subregistro en algunas edades (0-4) y las ocasionadas por la
preferencia de dgitos.
A pesar de los logros mencionados, la evidencia externa y la derivada del Censo 2005,
confirman la existencia de sobrestimacin de la poblacin menor de 1 ao; el impacto
importante de este comportamiento es sobre las proyecciones de poblacin. En los
ejercicios de conciliacin censal adelantados por el DANE, este efecto ya ha sido
considerado y controlado.
Sexo: el proceso de depuracin de la variable fue apropiado, pues una vez realizada la
depuracin de la informacin, la estructura de la poblacin por sexo, entre la base cruda y
la base final, no cambia.
No obstante, la comparacin con fuentes externas y el anlisis de la coherencia de la
informacin muestra un subregistro mayor de nias que de nios en la edad 0.
Nuevamente, el efecto de este comportamiento es sobre las proyecciones de poblacin y
al igual que con la edad, se ha considerado en el ejercicio de conciliacin censal
Las relaciones de masculinidad en otros grupos de edad, cuando se comparan con otras
fuentes, no permiten explicacin directa, por tanto, se considera que amerita la realizacin
de un estudio especfico para su anlisis.
Parentesco: los procesos de depuracin efectuados y su coherencia con fuentes
externas indican que la informacin sobre el parentesco no presenta limitantes para su
utilizacin.
Estado conyugal: esta informacin presenta consistencia y calidad; y al igual que la de
parentesco, no presenta limitantes para su utilizacin.
Pertenencia tnica: los valores absolutos de la poblacin Rom y los palenqueros, al pasar
de la base cruda a la final, experimentaron cambios significativos. A pesar de las
dificultades para la imputacin de la poblacin Rom, los resultados pueden utilizarse en
forma confiable.
Fecundidad: la evidencia presentada muestra la existencia de subregistro de los nacimientos ocurridos en el ao anterior a la fecha cuando la mujer en edad reproductiva fue
censada, la causa se atribuye a que los hijos de las mujeres censadas en el ao 2006 y

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

63

tenidos en este ao, por restricciones del instrumento de recoleccin, no podan quedar
incorporados en el ao de nacimiento o, en su defecto, quedar en aos diferentes al de la
ocurrencia del evento.
Un primer ejercicio realizado para determinar la incidencia del aparente subregistro, muestra
que s existe y que afecta en mayor medida a los nacidos vivos de madres censadas en
2006. El subregistro no limita la utilizacin de la informacin, pero recomienda la utilizacin
de metodologas especficamente diseadas para corregir este tipo de errores comunes en
censos y encuestas por muestreo.
Mortalidad: la fuente de informacin sobre mortalidad proviene del mdulo de hogares. La
comparacin de la estructura de las defunciones de la base cruda y la final no muestra
alteraciones con el proceso de depuracin de la informacin.
La comparacin con otras fuentes muestra que la informacin censal presenta un elevado
subregistro en la edad cero y despus de los sesenta aos de edad. Las defunciones en
los restantes grupos de edad presentan similar valor; es decir, tendran subregistro
parecido al de las estadsticas vitales.
Migracin interna: la estructura por condicin de migracin no cambia significativamente
entre la base cruda y la final. La informacin general de migracin puede utilizarse en
forma confiable.
La comparacin con otras fuentes muestra que la migracin por causas atribuibles al
desplazamiento forzado, encubre la real incidencia del problema. Este problema no es del
Censo 2005, est asociado a las dificultades que existen para obtener este tipo de
informacin en censos y encuestas.
Emigracin al exterior: la depuracin de los datos no presenta variaciones entre la base
cruda y la base final, pero los emigrantes al exterior de toda la vida captados por el Censo
2005 son, frente a cualquier estimacin, muy bajos, lo cual limita la utilizacin prctica de
esta variable.

Variables socioeconmicas
Alfabetismo: cerca del 3% de la informacin recolectada en papel se transcribi a los
DMC; para permitir el ingreso de la informacin se levantaron los controles que
aseguraban los flujos adecuados y la validacin de los datos incorporados. El proceso
afect la calidad de las variables educativas.
A los problemas relacionados con la trascripcin de la informacin recolectada en papel a
los DMC, se agrega que, a pesar de que las normas de imputacin eran las adecuadas, la
lgica del software desarrollado no se corresponda con ellas. Esto gener significativas
distorsiones en los niveles de analfabetismo y afectan, aunque en menor medida, los
niveles de escolaridad, tanto del pas, como de los departamentos y los municipios.
El ejercicio de correccin realizado fue el apropiado y la informacin resultante sobre el
alfabetismo de la poblacin es de calidad y puede utilizarse sin ningn tipo de correctivos.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

64

Asistencia escolar: la coherencia entre la base cruda y la base final y de esta ltima con
otras fuentes de informacin, es buena. No se evidencian errores en el tratamiento de
esta variable.
Nivel educativo y grado aprobado: exista el temor de que el proceso que afect la
variable relacionada con el alfabetismo impactara, igualmente, las variables relacionadas
con el nivel educativo y el grado alcanzado en ese nivel, pero no fue as, los cambios
observados en el indicador de escolaridad calculados con base en la informacin original
y los estimados en las dos bases siguientes (anterior y final) no son significativos, pero el
haber hecho el ejercicio de correccin del alfabetismo, confieren seguridad sobre la
calidad de la informacin educativa de nivel y grado.
Actividad realizada por las personas la semana anterior al censo: se observ que la
poblacin estudiante pierde representatividad, en particular la menor de 18 aos; mientras
que la poblacin ocupada, la gana. Se detect que en la informacin recolectada en papel
y transferida mediante escner (rutas), se le asign, tambin, la condicin de trabajador
familiar sin remuneracin a un gran nmero de menores de 18 aos que estaba estudiando.
El problema se genera cuando a estos ltimos, por una inadecuada interpretacin de la
norma de imputacin, se les transforma en trabajadores.
La correccin realizada, similar a la hecha en la variable alfabetismo, permite asegurar
que la informacin sobre la actividad realizada por las personas en la semana anterior al
censo, no presenta problema y que puede utilizarse en forma confiable. La correccin en
la variable actividad corrige automticamente la variable categora ocupacional.
Rama de actividad econmica: los resultados sobre la actividad econmica son muy
pobres, pues se presentan preguntas con niveles del 70% de no respuesta en la zona
urbana y del 46%, en la rural, lo que limitan su utilizacin confiable.

Variables de la vivienda y el hogar


De la vivienda y el hogar se contemplaron cuatro variables: tipo de la vivienda, condicin
de ocupacin, servicios pblicos bsicos y tamao del hogar. La estructura de ninguna de
ellas experimenta cambios significativos al pasar de la base cruda a la final, lo que elimina
cualquier restriccin para su uso.

Respuesta institucional a los problemas de depuracin detectados


Una vez detectados los problemas en las variables educativas y en la actividad en la semana anterior al censo, las directivas del DANE suministraron el recurso humano y tecnolgico
para profundizar en la fuente del problema y llevar los correctivos del caso para asegurar
que la informacin resultante tuviera los niveles de integridad y de calidad esperados.
Una vez precisada la fuente del problema en cada una de las variables, se llev a cabo la
correccin de la lgica del software de depuracin, se realizaron pruebas con base en
municipios crticos y se gener la base nacional con las correcciones requeridas. Los
correctivos aplicados cambian radicalmente el panorama de las variables e indicadores
tratados y se observa coherencia con los derivados de la base cruda.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

65

En la medida en que los errores detectados no eran problemas del Censo, sino de los
procesos de grabacin y lgica del software, la informacin de las variables, objeto de
tratamiento e incorporadas en la nueva base, dejan de ser una limitante para la utilizacin
confiable del Censo General 2005.

CONCLUSIONES Y RECOMENDACIONES

El Censo contina siendo la mejor y, la mayor parte de las veces, nica fuente para
conocer las caractersticas demogrficas y socioeconmicas de la poblacin y herramienta imprescindible para la planeacin econmica y social a nivel nacional, departamental y municipal.

Al igual que la mayora de los censos, el de 2005 presenta errores producto de la mala
informacin suministrada por el encuestado o el mal manejo por parte del encuestador
de los conceptos y los medios de recoleccin de la informacin. Adicional a ellos, en el
Censo aparece otro tipo de error generado por el manejo inadecuado de algunos
procesos o por una mala interpretacin y traduccin de las normas de imputacin en
algoritmos tiles para depurar la informacin.

Existen algunas caractersticas de la poblacin de difcil investigacin a travs de


censos y encuestas no especializadas; por ejemplo, la emigracin al exterior, el
desplazamiento forzado, la rama de actividad econmica y otras. Su inclusin debe
evaluarse cuidadosamente.

La calidad de la informacin recolectada en el Censo 2005, por la utilizacin de los


DMC en la recoleccin es, en trminos generales, superior a la que arrojan censos
anteriores. El cambio tecnolgico incorporado es irreversible; de ninguna forma puede
regresarse a la recoleccin de la informacin en papel; por el contrario, para futuros
eventos censales debe utilizarse los ltimos desarrollos, tanto en tecnologa blanda,
como dura.

Una variable que demand tratamiento especial fue la fecundidad; problemas en el proceso de recoleccin de la informacin, determinaron la necesidad de profundizar en su
anlisis. El ejercicio realizado permite sealar que existe el subregistro de los hijos
nacidos vivos tenidos por las mujeres en el ltimo ao, pero aplicando metodologas
especficas diseadas para ajustar informacin por falta de respuesta, la informacin
sobre esta variable puede utilizarse en forma confiable.

La revisin y correccin de la lgica del software utilizado para la aplicacin de las normas de imputacin, debida a los problemas detectados en el proceso de depuracin de
la informacin, permiten que las variables educativas y la correspondiente a la actividad
realizada en la semana anterior al censo, se puedan utilizar en forma confiable.

Una vez obtenida informacin precisa sobre las variables educativas y de la actividad de
la persona, no existe evidencia de problemas que invaliden el Censo. Las limitaciones
menores que se detectaron, afectan en particular al estudio de conciliacin censal; en l
se les dio el tratamiento requerido.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

66

Es necesario integrar y complementar los resultados del anlisis llevado a cabo con el
ejercicio de conciliacin censal, en la medida que algunos de los hallazgos pueden
condicionar los parmetros y variables fundamentales utilizados en este ejercicio.

El anlisis de integridad y calidad de la informacin, como el efectuado en el presente


estudio, debe institucionalizarse como proceso bsico del Censo.

Los niveles de cobertura siguen siendo una de las principales inquietudes sobre el
Censo; sin embargo, y sin restar la importancia que este parmetro tiene en los
resultados, puede sealarse que la informacin censal puede utilizarse en forma
confiable.

Algunas lecciones aprendidas


Del anlisis de la informacin y de los problemas detectados, surgen indicadores
relacionados con el uso de la tecnologa y la calidad de algunos procesos que deben
tomarse en consideracin para futuros censos.

Los errores detectados en el Censo General 2005 deben minimizarse en futuros


censos; para el efecto, se requiere analizarlos, sistematizarlos y disear los controles
necesario para que estos no ocurran o su incidencia sea muy baja.

En relacin con las caractersticas de la poblacin de difcil investigacin, para futuros


censos es recomendable, no slo revisar los resultados de pasadas experiencias, sino
tambin realizar las suficientes pruebas de campo que aseguren la calidad final de la
informacin investigada.

El avance tecnolgico ms importante incorporado en el Censo 2005 corresponde a la


recoleccin de la informacin mediante los DMC. Su utilizacin mejora significativamente la calidad de los resultados. No obstante, para eventos futuros, surgen algunas
recomendaciones:
-

La tecnologa y software de captura que vaya a utilizarse debe estar los suficientemente validada y configurada antes de iniciar el operativo censal.

El uso de la tecnologa no est exenta de enfrentar problemas emergentes en el


proceso de recoleccin de la informacin (utilizacin de formularios en papel). Ante
la eventualidad de que esto ocurra, los procesos deben estar plenamente definidos,
incluyendo la necesaria supervisin y control de calidad.

El diseo, alistamiento y ejecucin del Censo, deben responder a tiempos previamente


establecidos y que deben cumplirse estrictamente. Las eventualidades surgidas durante
el operativo, no pueden ir en contra de la integridad y calidad de la informacin.

Los procesos de trascripcin de la informacin de papel a DMC y la depuracin de la


informacin deben estar sujetos a controles exhaustivos de calidad.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

67

Prestar especial atencin a los procesos de capacitacin y supervisin: en el primero


de los casos debe darse nfasis al manejo de los conceptos bsicos, no slo para la
captura mediante los DMC, sino tambin para el empadronamiento en papel; en el
segundo, para que pueda llevarse a cabo una adecuada supervisin, racionalizar las
actividades propias que debe realizar el supervisor.

No es suficiente contar con cartografa, lo que es valioso para el Censo es su


actualizacin. El DANE debe emprender el proceso de actualizacin teniendo en
cuenta los requerimientos de los censos para la organizacin del operativo y,
conjuntamente con otros instrumentos, apoyar el aseguramiento de la cobertura
censal.

El anlisis de integridad de la informacin, como el efectuado en el presente estudio,


debe institucionalizarse como proceso bsico del Censo.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

68

ANEXOS
Anexo A. Metodologa para determinar los niveles de subregistro de los
nacimientos de las mujeres censadas en 2006
1. Fundamento
Los hijos sobrevivientes menores de un ao, reportados por las mujeres en edad
reproductiva, son una buena aproximacin a los hijos nacidos que los originan. La
mortalidad infantil a la que estos ltimos se ven sometidos, no alteran en forma significativa
las tasas de fecundidad estimadas con base en ellos.
2. Limitaciones

Para no toda la poblacin menor de un ao se report la fecha de nacimiento: subregistro de la poblacin.

Existe una sobrestimacin de la poblacin menor de un ao cuando esta se estima


con base en la edad reportada.

Se producen ligeras distorsiones producto de malas declaraciones de la edad o la


fecha de nacimiento por efecto recordacin.

3. Metodologa
Para tener en cuenta las dos primeras limitaciones, la propuesta metodolgica toma como
fundamento las mediciones de las tasas de las mujeres censadas en 2005 y 2006; para el
efecto se incluyen 3 diferentes mediciones para cada conjunto de poblacin:
1. Tasa Global de Fecundidad TGF originada por las mujeres en edad frtil y la poblacin menor de un ao, estimada con base en la fecha de nacimiento (lmite inferior).
2. TGF de las mujeres en edad frtil y la poblacin menor de un ao estimada con base
en la edad (lmite superior).
3. TGF calculadas con base en la informacin de ao y mes cuando la mujer tuvo su
ltimo Hijo Nacido Vivo HNV.
La comparacin entre los estimativos para las mujeres censadas en 2005 tienen como
objetivo validar o negar la metodologa; mientras que los relacionados con las encuestadas en 2006 proporcionan indicativos sobre los niveles de subregistro de los hijos nacidos
en 2006.
4. Proceso
Para obtener los diferentes estimativos se llev a cabo el siguiente proceso:

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

69

Para las mujeres censadas en 2005 y 2006 con informacin sobre hijos
sobrevivientes

Identificacin en la base nacional de la poblacin menor de un ao, segn edad y fecha


de nacimiento.
Asignacin a cada hogar del nmero de hijos menores en las dos dimensiones.
Conformacin de dos grupos de mujeres en edad frtil: las censadas en 2005 y 2006.
Para cada uno de los grupos, en lo posible, identificar las madres de los menores, para
lo cual se aplican los siguientes filtros secuenciales y excluyentes entre s:
-

Se consideran sin hijos aquellas que informan que no han tenido hijos vivos
durante su vida reproductiva (pregunta 56, opcin 2) (cuadro A2).

Cuadro A1
Mujeres, segn nmero de menores en el
hogar
Mujeres
Menores en el
hogar
Frecuencia Porcentaje
Total
Sin menores
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Fuente: DANE

2 819 367
2 484 449
303 455
18 872
2 742
8 478
690
264
108
185
36
38
3
44
1
2

100,0
88,1
10,8
0,7
0,1
0,3
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0

Cuadro A2
Correccin por HNV
Menores en el
hogar
Total
Sin menores
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Mujeres
Frecuencia

Porcentaje

2 819 367
2 533 865
258 901
15 657
2 216
7 600
574
203
95
150
32
30
3
38
1
2

100,0
89,9
9,2
0,6
0,1
0,3
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0

Fuente: DANE

Se incluyen todas las mujeres en hogares en los que el nmero de ellas en edad
frtil es igual al nmero de menores reportados (cuadro A3).

Se consideran con hijos las que informaron que tuvieron un HNV en 2005 (cuadro
A4).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

70

Cuadro A3
Correccin por mujeres en el hogar
Mujeres/nios en el
hogar
Total
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1 mujer, 1 menor
2 mujeres, 2 menores
3 mujeres, 3 menores
4 mujeres, 4 menores
5 mujeres, 5 menores
6 mujeres, 6 menores
7 mujeres, 7 menores
8 mujeres, 8 menores
Fuente: DANE

Frecuencia
2 819 367
2 533 865
114 209
10 228
1 448
1 947
328
110
43
108
32
30
3
38
1
2
144 692
5 429
768
5 653
246
93
52
42

Cuadro A4
Consideracin por ltimo HNV
Porcentaje
100,0
89,9
4,1
0,4
0,1
0,1
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
5,1
0,2
0,0
0,2
0,0
0,0
0,0
0,0

Mujeres/nios en el
hogar
Total
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1 mujer, 1 menor
2 mujeres, 2 menores
3 mujeres, 3 menores
4 mujeres, 4 menores
5 mujeres, 5 menores
6 mujeres, 6 menores
7 mujeres, 7 menores
8 mujeres, 8 menores
Con ltimo HNV

Frecuencia

Porcentaje

2 819 367
2 533 865
82 829
7 383
1 081
1 722
282
92
42
92
24
27
3
32
1
2
144 692
5 429
768
5 653
246
93
52
42
34 915

100,0
89,9
2,9
0,3
0,0
0,1
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
5,1
0,2
0,0
0,2
0,0
0,0
0,0
0,0
1,2

Fuente: DANE

Cuando el grupo quinquenal de edad de mujeres contiguas en un mismo hogar es


el mismo y se consideran como informacin replicada, a una de ellas se le
considera con hijo y a la pareja, sin l. Para efectos de la medicin de las tasas el
procedimiento es correcto (cuadro A5).

No todas las personas inicialmente consideradas como informacin duplicada,


triplicada, lo continan siendo, por lo que el ejercicio para identificar las rplicas
reporta algunas personas que dejaron de ser replicas y pueden incluirse en el
grupo de mujeres con nios menores (54 186) (cuadro A6).

Finalmente, quedan personas que tienen una o ms rplicas y que no pudieron


identificarse (30 906); con ellas se conforma un archivo del cual se extraen en
forma aleatoria aquellas personas que hacen falta para completar el total de
menores observados inicialmente (3 955) (cuadro A7).

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

71

Cuadro A5
Parejas en igual grupo quinquenal de edad
Mujeres/nios en el hogar
Frecuencia
Total
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1 mujer, 1 menor
2 mujeres, 2 menores
3 mujeres, 3 menores
4 mujeres, 4 menores
5 mujeres, 5 menores
6 mujeres, 6 menores
7 mujeres, 7 menores
8 mujeres, 8 menores
Con ltimo HNV
Mismo grupo de edad

2 819 367
2 537 361
76 134
6 407
769
1 444
151
54
21
54
19
19
3
14
1
2
144 692
5 429
768
5 653
246
93
52
42
34 915
5 024

Porcentaje
100,0
90,0
2,7
0,2
0,0
0,1
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
0,0
5,1
0,2
0,0
0,2
0,0
0,0
0,0
0,0
1,2
0,2

Fuente: DANE

Cuadro A6
Replicas que permanecen en el archivo
Concepto
Frecuencia Porcentaje
Total
85 092
100,0
Sin rplica
54 186
63,7
Una rplica
29 275
34,4
Dos rplicas
1 631
1,9
Fuente: DANE

Cuadro A7
Resumen
Concepto
Total
Sin menores
Con hijos
Rplicas

Mujeres
Frecuencia Porcentaje
2 819 367
100,0
2 537 361
90,0
251 100
8,9
30 906
1,1

Fuente: DANE

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

72

Con base en el archivo depurado se estima la TGF derivada de los nios menores.
Cuadro A8
Tasas especficas de fecundidad y TGF, con base en
la edad al nacimiento
Menores
Grupos de
Tasa
edad (aos) Mujeres
especfica
15-19
570 756
0,08
44 460
20-24
470 674
0,14
66 973
25-29
426 706
0,12
50 731
30-34
381 972
0,09
35 059
35-39
369 797
0,07
26 402
40-44
324 501
0,06
18 310
45-49
274 961
0,05
13 120
Sumatoria
0,61
255 055
TGF
3,03
Fuente: DANE

Para las mujeres censadas en 2005 y 2006 con informacin sobre hijos ao y mes
del ltimo hijo nacido vivo
Es preciso generar el promedio de dos estimativos de las TGF:

Alto: ao y mes de nacimiento +12>= a mes del censo (sobrestima los nacimientos)
Bajo: ao y mes de nacimiento +12> a mes del censo (subestima los nacimientos)

Cuadro A9
TGF con base en ltimo HNV, por estimativo
Mujeres censadas en 2006
Grupos de edad (aos)
15-19
20-24
25-29
30-34
35-39
40-44
45-49
Sumatoria
TGF

Alto
0,09
0,16
0,13
0,09
0,06
0,02
0,00
0,55
2,74

Bajo
0,08
0,14
0,11
0,08
0,05
0,02
0,00
0,50
2,48

Medio
0,09
0,15
0,12
0,09
0,05
0,02
0,00
0,52
2,61

Fuente: DANE

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

73

5. Resultados

Los resultados para la poblacin censada en 2005 muestran que la metodologa,


aunque puede afinarse, suministra resultados consistentes que permiten evaluar el
impacto de la no inclusin de los nacimientos ocurridos en 2006, en el ao
correspondiente (cuadros A10 y grficos A1).

El subregistro de los HNV en el ltimo ao existe, afecta en mayor medida a los hijos
de las mujeres censadas en 2006.

El denominador de los menores de un ao corresponde a todas las mujeres en edad


frtil entre 15 y 49 aos; para el ltimo hijo nacido vivo, toma a las mujeres que
informaron haber tenido o no algn hijo nacido vivo (excluye cdigo 9 en la pregunta
55: 117 688 mujeres). Este control reduce la importancia de la no inclusin de todos
los nacidos en 2006 (cuadro A11).

Cuadro A10
Tasas especficas y global de fecundidad, segn fuente de estimacin
Nacidos en 2005 y 2006
2005
2006
Grupos de
edad
Fecha de
ltimo
Fecha de
ltimo
Edad 0
Edad 0
(aos)
nacimiento
HNV
nacimiento
HNV
15-19
0,06
0,06
0,06
0,08
0,08
0,09
20-24
0,10
0,09
0,10
0,14
0,13
0,15
25-29
0,09
0,09
0,09
0,12
0,11
0,12
30-34
0,07
0,07
0,07
0,09
0,08
0,09
35-39
0,05
0,04
0,04
0,07
0,06
0,05
40-44
0,03
0,02
0,01
0,06
0,04
0,02
45-49
0,02
0,02
0,00
0,05
0,03
0,00
Sumatoria
0,42
0,39
0,38
0,61
0,53
0,52
TGF
2,11
1,97
1,89
3,03
2,67
2,61
Fuente: DANE. Censo General 2005

Cuadro A11
Condicin de paridez
Censo 2005
Concepto
Con HNV
Sin HNV
Ns/Nr
Total

Mujeres
Frecuencia
Porcentaje
1 863 632
66,1
838 047
29,7
117 688
4,2
2 819 367
100,0

Fuente: DANE. Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

74

Grfico A1
Tasas especficas de fecundidad, segn fuente de estimacin
MEF censadas en 2005 y 2006

2005
,12
,10
Ultimo HNV
Fecha nacimiento

Tasas

,08

Edad 0

,06

,04
,02
,00
15-19

20-24

25-29

30-34

35-39

40-44

45-49

Grupos de edad

2006
0,16
0,14
Edad 0

0,12

Fecha Nacimiento
ltimo HNV

Tasas

0,1
0,08
0,06
0,04
0,02
0
15-19

20-24

25-29

30-34

35-39

40-44

45-49

Grupos de edad
Fuente: DANE. Censo General 2005

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

75

6. Balance

Las metodologas diseadas y utilizadas en censos y encuestas por muestreo, para ajustar los indicadores de fecundidad, contribuiran a reducir los diferenciales observados.

Aunque debera profundizarse en el anlisis, afinando la metodologa de estimacin y


evaluando los impactos a nivel departamental y municipal, puede sealarse que el problema, al que se hizo mencin en el documento, no es de la magnitud indicada y que la
informacin puede utilizarse efectuando los ajustes recomendados para esta
informacin.

Se recomienda profundizar en el anlisis tomando en consideracin desagregaciones a


nivel departamental y municipal.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

76

Anexo B. Respuesta institucional al problema detectado en las variables


educativas y en las relacionadas con la actividad de las personas en la
semana anterior al censo
Variables educativas
Como resultado de la revisin de las tasas de alfabetismo entre la base cruda y la depurada, se encontr, en algunos departamentos, que la tasa de analfabetismo crece con la
informacin depurada, lo cual no es coherente. Respecto a este caso, se encuentra que
dicho incremento ocurre en aquellos departamentos con un porcentaje de blanco superior
al 2%. Se realiz la revisin de la informacin contenida en la base cruda y se encontr lo
siguiente:

Estos casos corresponden a los municipios del grupo tres, en los cuales la recoleccin
se realiz en formulario en papel (no para escner).

Su grabacin se realiz en DMC sin ningn tipo de validacin.

Fuente de error
Durante el operativo y grabacin de la informacin:

Iniciar operativo de recoleccin sin haber finalizado el alistamiento. No se contaba con


todos los DMC requeridos para la recoleccin de la informacin.

Utilizar formularios en papel para iniciar la recoleccin de la informacin.

No hubo la capacitacin ni supervisin suficiente en esta etapa de recoleccin de la


informacin; por ejemplo, la informacin sobre la pertenencia tnica.

Determinar que la informacin en papel deba trascribirse a los DMC y suprimir los
controles para la validacin de los datos incorporados. Lo anterior, determin que la
variable nivel quedara en blanco, dado que en el formulario no existe marcacin para
esta variable y en la grabacin no se implement ningn tipo de supervisin, sumado
al hecho de no tener normas de validacin de rangos para el DMC.

Ausencia de control de calidad a la informacin trascrita a los DMC.

En la depuracin de la informacin:

Las normas de imputacin son las recomendadas; no obstante, la lgica del software
desarrollado no corresponde con ellas.

No hubo el suficiente control de calidad sobre los resultados del proceso de imputacin de la informacin educativa.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

77

Correctivos
En consideracin al cambio de la tasa con la informacin depurada, se realiz el siguiente
proceso:

Se revis el documento de normas, las cuales no generan el resultado final observado.

Se revis el cdigo CSPRO que se implement, encontrndose un cambio de lgica de


las normas para el manejo de blancos, por lo siguiente:
-

Se define una funcin que estructura una variable que maneja de forma conjunta
nivel-ao, cuyo rango es de 1 a 42 para nivel_ao vlido, 43 para nivel ninguno, 98
para ltimo ao invlido, y 99 para nivel-ao invlido. Este proceso es necesario
para facilitar la implementacin de las normas definidas; sin embargo, dicha funcin
no hace una evaluacin de la informacin del nivel y/o ao y asigna directamente en
este caso, blanco a esta variable auxiliar.

En una segunda fase, al venir en blanco la variable auxiliar, no entra en la rutina que
permite, mediante una imputacin en caliente, recomponer la variable nivel_ao
segn la edad y le asigna cdigo 43 (ningn nivel), lo cual determina que en las
fases siguientes del proceso se asigne en la pregunta 41 (sabe leer y escribir?)
cdigo 2 (No) y el ltimo ao quedara sin informacin, lo cual determina una
reduccin de la escolaridad.

Lo anterior determina que la tasa de analfabetismo se incremente fuertemente en aquellos


entes territoriales donde la proporcin de blancos sea alta, no por problemas del censo,
sino por procesos de grabacin y lgica del software de depuracin. La falta de tiempo
tambin determina que no se pueda detectar en la fase de anlisis, al no poderse mirar
este indicador a nivel departamental y municipal.
Proceso y pruebas realizadas
Al identificar el problema, se realiz el siguiente proceso:
1. Se actualiza la base depurada con los datos de la base cruda correspondientes a las
variables originales de las preguntas 41 (sabe leer y escribir; libros) y 44 (nivel y aos
alcanzados). Para esto se realiza un aplicativo en CSPRO utilizando el nmero de
registro que es nico y se mantiene en todo el proceso de depuracin.
2. Se realiza el ajuste a la funcin que crea la variable auxiliar con el fin de garantizar el
funcionamiento adecuado de la imputacin en caliente del nivel y ao, en aquellos
casos que sean inconsistentes. Esto permite garantizar la imputacin adecuada de la
pregunta 41 (alfabetismo). Igualmente, se realizan ajustes en la programacin para
garantizar la lgica con las normas definidas.
3. En la parte de alfabetismo, se corrige el algoritmo que estaba blanqueando de forma
genrica la variable libros ledos, al considerar que sta es ampliada. Este ajuste
consiste en controlar primero por formulario ampliado, si esta variable trae
informacin, y si la pregunta 41 est en blanco, realizar la correspondiente imputacin
(si libros es 1 o ms y la 41 est en blanco se asigna alfabeto (1); en caso contrario,

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

78

se tiene en cuenta la informacin de nivel y aos aprobados. En el caso del


cuestionario bsico, la variable libros es no aplica.
4. Se realizaron una serie de pruebas con la Localidad 12 Barrios Unidos de Bogot,
D.C. con municipios con alta presencia de poblacin indgena y elevadas tasas de
analfabetismo y con municipios no indgenas y altas tasas en el indicador.

Resultados
Analfabetismo: las correcciones cambian el panorama del analfabetismo obtenido con
la base que contena los errores y es coherente con el obtenido en la base cruda. Para
la poblacin de 15 aos y ms, del nivel nacional, la base cruda muestra un valor del
indicador del 8,9%; el tratamiento inadecuado de los valores en el nivel educativo y los
aos aprobados lo incrementa al 9,6%; una vez se corrige la sintaxis, nuevamente el
analfabetismo toma un valor inferior al observado en la base cruda: el 8,3% (grficos B1
y B2).
Con excepcin de los departamentos de los antiguos territorios nacionales, excepto el
Archipilago de San Andrs, Providencia y Santa Catalina y algunos con alta presencia
indgena, Cauca y Nario, los diferenciales en el analfabetismo obtenido con la base
cruda y la corregida, desaparecen. De igual forma, en su comparacin con la base
anterior (con errores), se observan las mejoras que experiment la mayor parte de ellos.
Grfico B1
Tasas de analfabetismo para poblacin de 15 aos y ms, por base, segn departamento
Censo 2005
40
35
30

Tasa

25
20
15
Cruda

10

Anterior

Final
La Guajira

Sucre

Choc

Guaina

Crdoba

Cesar

Vichada

Bolvar

Magdalena

Caquet

Nario

N. Santana.

Arauca

Cauca

Tolima

Boyac

Vaups

Guaviare

Huila

Casanare

Total

Amazonas

Putumayo

Santander

Meta

Antioquia

Caldas

Quindo

Atlntico

Risaralda

Valle

Cundinam.

Bogot

San Andrs

Departamento

Fuente: DANE Censo General 2005

Por comuna de Medelln y localidad de Bogot, D.C., los efectos de los correctivos aplicados son ms claros, las mejoras en la mayor parte de ellas son significativas y las nuevas
tasas de analfabetismo son similares a las observadas en la base cruda (grfico B2)

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

79

Grfico B2
Tasas de analfabetismo para Bogot y Medelln, por localidad
Censo 2005
25
Cruda

20

Anterior
Final

Tasa

15

10

11020

11019

11018

11017

11016

11015

11014

11013

11012

11011

11010

11009

11008

11007

11006

11005

11004

11003

11002

5099

11001

5016

5015

5014

5013

5012

5011

5010

5009

5008

5007

5006

5005

5004

5003

5002

5001

Localidad

Fuente: DANE Censo General 2005

En conclusin, puede afirmarse que el ejercicio de correccin realizado fue el apropiado y


que la informacin sobre el alfabetismo de la poblacin es de calidad y puede utilizarse,
sin ningn tipo de correctivos, para los efectos que se requiera (cuadro B1).
Cuadro B1
Tasas de analfabetismo para poblacin de 15 aos y ms,
por base, segn departamento
Censo 2005
Departamento
Total
Antioquia
Atlntico
Bogot, D.C.
Bolvar
Boyac
Caldas
Caquet
Cauca
Cesar
Crdoba
Cundinamarca
Choc
Huila
La Guajira
Magdalena
Meta
Nario
Norte de Santander

Cruda

Anterior

Final

8,9
7,7
6,9
2,7
13,5
11,1
7,5
11,4
13,4
16,0
19,2
7,0
20,5
10,0
29,9
15,5
7,4
13,9
10,9

9,6
9,2
6,3
5,2
13,9
10,9
7,1
14,8
12,9
15,5
18,2
7,7
24,2
10,2
35,6
15,3
7,8
13,9
10,6

8,3
7,3
6,5
2,2
12,7
10,0
6,8
10,8
10,2
16,3
18,6
6,1
20,0
8,8
29,0
15,2
7,2
10,8
11,0

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

80

Cuadro B1 (conclusin)
Tasas de analfabetismo para poblacin de 15 aos y ms,
por base, segn departamento
Censo 2005
Departamento

Cruda

Anterior

Final

Quindo
Risaralda
Santander
Sucre
Tolima
Valle del Cauca
Arauca
Casanare
Putumayo
Archipilago de San Andrs,
Providencia y Santa Catalina
Amazonas
Guaina
Guaviare
Vaups
Vichada

7,0
7,3
8,2
20,3
10,9
5,8
9,7
9,3
9,2

6,1
6,4
7,5
19,1
10,9
5,4
12,9
9,0
11,4

6,8
6,7
7,6
19,4
10,5
5,1
10,6
9,0
7,6

2,4

1,5

1,9

9,8
18,1
9,5
10,3
16,7

11,0
18,2
20,5
25,8
24,2

8,2
17,4
8,5
8,3
15,6

Fuente: DANE Censo General 2005

Escolaridad: para hacer comparable los resultados entre la base cruda y restantes versiones, a las personas sin nivel educativo (cdigo 13) y aos de educacin en blanco en
la primera base, se les considera con escolaridad 0. El supuesto planteado en el texto era
que podra existir conexin entre los errores observados en el analfabetismo y los niveles
de escolaridad; esto no es as, con la consideracin hecha, los cambios observados entre
la primera y subsiguientes base no son de significancia, pero confieren seguridad sobre la
calidad de la informacin educativa (cuadro B2).
Cuadro B2
Escolaridad para poblacin de 15 aos o ms, por base,
segn departamento
Departamento
Total
Antioquia
Atlntico
Bogot, D.C.
Bolvar
Boyac
Caldas
Caquet
Cauca
Cesar
Crdoba
Cundinamarca
Choc

Cruda

Anterior

Final

7,7
7,6
8,7
9,8
7,4
6,7
7,3
6,1
6,1
6,7
6,3
7,2
6,5

7,6
7,6
8,7
9,7
7,3
6,7
7,2
6,1
6,1
6,7
6,3
7,2
6,4

7,7
7,6
8,7
9,8
7,4
6,7
7,3
6,1
6,1
6,7
6,3
7,2
6,4

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

81

Cuadro B2 (conclusin)
Escolaridad para poblacin de 15 aos o ms, por base,
segn departamento
Departamento
Huila
La Guajira
Magdalena
Meta
Nario
Norte de Santander
Quindo
Risaralda
Santander
Sucre
Tolima
Valle del Cauca
Arauca
Casanare
Putumayo
Archipilago de San Andrs,
Providencia y Santa Catalina
Amazonas
Guaina
Guaviare
Vaups
Vichada

Cruda

Anterior

Final

6,5
5,7
6,8
7,5
6,1
6,8
7,5
7,3
7,4
6,3
6,8
8,1
6,9
6,6
6,2

6,5
5,8
6,8
7,4
6,1
6,8
7,5
7,3
7,4
6,3
6,8
8,1
6,9
6,5
6,1

6,5
5,8
6,8
7,5
6,1
6,8
7,5
7,3
7,4
6,3
6,8
8,1
6,9
6,6
6,2

9,2
7,2
5,7
6,2
7,2
5,3

9,2
7,2
5,6
6,2
7,2
5,3

9,2
7,2
5,6
6,2
7,2
5,4

Fuente: DANE Censo General 2005

Actividad la semana anterior al Censo 2005


El error en la actividad realizada por las personas, en particular de las menores de edad,
se gener cuando en algunos de los hogares cuya informacin se obtuvo mediante formularios en papel, adems de la condicin de estudiante no trabajador (cdigo 5, pregunta
47) se le consign, igualmente, la condicin de trabajador familiar sin remuneracin
(cdigo 5, pregunta 49), y sin atender el salto sealado en el formulario (pregunta 7,
cdigos 4 a 9: pase a pregunta 51).
Las normas de imputacin son claras y consistentes; no obstante, la lgica del algoritmo
de imputacin desarrollada, para interpretarla, contribuy a incrementar el problema: a los
estudiantes que, a la vez, se declararon como trabajadores familiares sin remuneracin se
les quit la condicin de actividad sealada (cdigo 5, en pregunta 47) y se les convirti
en trabajadores (cdigo 1, pregunta 47). La revisin llevada a cabo implic:

La recuperacin de los registros originales contenidos en la base cruda.

Aplicacin de las normas de imputacin, especficamente para el problema sealado,


doble respuestas, as:
- Si la pregunta 47 = no aplica y pregunta 49 es valida, se asigna cdigo 1 (trabaj)
en pregunta 47.

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

82

Si en la pregunta 47 tiene valores entre 4 y 9, no se considera informacin de


preguntas 49 y 50 (se blanquea).

Conformacin de la nueva base con la informacin de los registros objeto de


imputacin.

Una vez corregidos los errores, la informacin obtenida con la base cruda y la final es
coherente; los valores absoluto correspondientes a los aspirantes a obtener su primer
trabajo y la poblacin en condicin de inactividad econmica, son prcticamente iguales
entre la base original y la corregida.
Las modificaciones incorporadas a la lgica del algoritmo de imputacin aseguran que la
informacin sobre la actividad de las personas en la semana anterior al Censo 2005 y por
extensin, la relacionada con la categora ocupacional, que tambin experimenta
modificaciones, pueda utilizarse en forma confiable (cuadro B3).
Cuadro B3
Actividad en la semana anterior al Censo, por grupos de edad, segn base
Censo 2005
5 - 11 aos
12 - 17 aos
18 y ms aos
Actividad semana anterior
PorcenPorcenPorcenRecuento
Recuento
Recuento
taje
taje
taje

Total
0
Trabaj
No trabaj, tena trabajo
Busco trabajo, haba
trabajado
Busc trabajo primera vez
Estudi, no trabaj, no
busc
Oficios del hogar
Incapacitado
Jubilado, rentista
Otra situacin

5 903 808
14 831
23 090
12 298

Total
0
Trabaj
No trabaj, tena trabajo
Busco trabajo, haba
trabajado
Busc trabajo primera vez
Estudi, no trabaj, no
busc
Oficios del hogar
Incapacitado
Jubilado, rentista
Otra situacin

6 052 950
164 389
95 995
12 323

Base cruda
100,0
4 885 089
0,3
7 856
0,4
354 684
0,2
19 594

100,0
0,2
7,3
0,4

25 203 039
23 463
12 650 794
305 433

100,0
0,1
50,2
1,2

1 028
2 664

0,0
0,0

26 260
25 540

0,5
0,5

872 407
179 304

3,5
0,7

4 492 070
147 226
22 689
2 863
1 185 049

76,1
2,5
0,4
0,0
20,1

3 281 217
419 214
21 768
2 150
726 806

67,2
8,6
0,4
0,0
14,9

1 211 015
6 528 687
446 572
739 610
2 245 754

4,8
25,9
1,8
2,9
8,9

Base anterior
100,0
4 994 283
2,7
115 404
1,6
401 838
0,2
19 636

100,0
2,3
8,0
0,4

26 021 637
814 036
12 691 353
305 722

100,0
3,1
48,8
1,2

1 025
2 595

0,0
0,0

26 224
25 014

0,5
0,5

872 266
176 883

3,4
0,7

4 421 652
147 148
22 689
0
1 185 134

73,0
2,4
0,4
0,0
19,6

3 239 324
418 221
21 764
0
726 858

64,9
8,4
0,4
0,0
14,6

1 200 833
6 525 065
446 853
739 571
2 249 055

4,6
25,1
1,7
2,8
8,6

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

83

Cuadro B3 (conclusin)
Actividad en la semana anterior al Censo, por grupos de edad, segn base
Censo 2005
5 - 11 aos
12 - 17 aos
Actividad semana anterior
PorcenPorcenRecuento
Recuento
taje
taje

Total
0
Trabaj
No trabaj, tena trabajo
Busco trabajo, haba
trabajado
Busc trabajo primera vez
Estudi, no trabaj, no busc
Oficios del hogar
Incapacitado
Jubilado, rentista
Otra situacin

6 052 950
164 389
25 440
12 323

18 y ms aos
PorcenRecuento
taje

Base final
100,0
4 994 283
2,7
115 404
0,4
359 164
0,2
19 636

100,0
2,3
7,2
0,4

26 021 637
814 035
12 675 904
305 722

100,0
3,1
48,7
1,2

872 266
179 285
1 212 735
6 525 627
446 901
739 620
2 249 542

3,4
0,7
4,7
25,1
1,7
2,8
8,6

1 025
2 690
4 492 104
147 148
22 689

0,0
0,0
74,2
2,4
0,4

26 224
25 546
3 281 434
418 230
21 765

0,5
0,5
65,7
8,4
0,4

1 185 142

19,6

726 880

14,6

Fuente: DANE

Grupo Mixto 2.2: Variables demogrficas y socioeconmicas

84

You might also like