PRÁCTICA D: Cómo trabajar
con los datos del censo
Enlace
al Boletín
Enlace
a la página de consejos
Consultas y
análisis de los datos del censo
En esta práctica,
analizaremos una pequeña parte de los datos del
censo de 1990 para la zona de Greater Boston.
Los datos del censo necesarios están en el archivo
C:\11_208\data\boston90.dbf.
El diccionario de datos de este archivo se encuentra
al final de esta página.
En este ejercicio
se puede utilizar tanto MS Access® como MS Excel®.
La base de datos
contiene los datos del censo de los grupos de bloques
de cinco condados de Greater Boston. El diccionario
de datos situado al final de esta página contiene
un listado de los códigos censales de 3 dígitos
de cada condado. Utilizando Access, observémos
por un minuto la base de datos para hacernos una idea
de su tamaño y contenidos. Tiene un tamaño
abrumador, ¿verdad? Sería difícil
manejar una base de datos de semejante tamaño
utilizando sólo programas de hojas de cálculo.
Sin embargo, el hecho de utilizar herramientas de gestión
de bases de datos puede facilitar enormemente esta labor.
Diseñar
las consultas necesarias para completar la siguiente
tabla:
| Sumario
de estadísticas de Greater Boston,
1989 |
| Nombre del condado
|
Número de
grupos de bloques |
Número de
distritos censales |
Número de
familias |
Número de
familias con una renta inferior a 15000$ |
Porcentaje de familias
con una renta inferior a 15000$ |
| Essex |
|
150 |
|
|
|
| Middlesex |
1231 |
|
|
|
|
| Norfolk |
|
|
227868 |
31171 |
14% |
| Plymouth |
|
|
|
|
|
| Suffolk |
|
|
|
|
|
| Total |
|
827 |
|
257716 |
|
Hemos rellenado
algunas partes de la tabla para que puedan comprobar
si van por buen camino. Primero, piensen en cómo
diseñar las consultas para obtener la información
necesaria. Luego, ejecuten las consultas necesarias
para completar la tabla. Es importante remarcar que
dificilmente se logrará completar toda la información
de esta tabla si se intenta diseñar una única
consulta. De hecho, es mucho más claro y sencillo
diseñar y ejecutar varias consultas. ¡Una
por una!
Nota:
si en algún momento, se quiere guardar un archivo
para realizar algún tipo de cálculo con
Excel, se deberá exportar el archivo a Excel
mediante la opción Guardar como > Exportar...;
luego, en la ventana Guardar como, seleccionar
A una base de datos o archivo externo. Una forma
de hacerlo es guardarlo como tipo (*.dbf), como,
por ejemplo, dBase 5. Una vez guardado así, se
podrá abrir fácilmente desde Excel. Recordar
que si una vez realizados los cálculos en Excel
se desea volver a traer los datos a Acces, habrá
que guardarlos como archivo .dbf, como archivo de Excel
o como archivo .txt. Luego se deberán seguir
los procedimientos de importación desde Access
aprendidos en las Prácticas C (para importar
archivos *.dbf) y B (para importar archivos *.txt).
Recordar también
que, en MS Excel, antes de guardar una hoja de cálculo
en formato *.dbf, hay que comprobar: 1) que la letra
de toda la hoja de cálculo es de 10 o 12 puntos;
2) que no hay fórmulas en las columnas, sino
sólo valores [se pueden Copiar, luego
seleccionar la opción Pegado especial
y luego Pegar valores]; y 3) que los tamaños
de todos los encabezados de columna han sido reestructurados.
Indicación
sobre MS Access: para calcular los totales es necesario
obtener primero una lista sin duplicados, mediante la
opción Valores únicos. Sin embargo,
puede que al contar esta lista se obtenga el mismo total
que al contar toda la columna, debido a que el ordenador
está respondiendo en función de la tabla
en la que se basa la consulta y no en la columna reducida
creada por nosotros. Para evitar esto, habrá
que construir la consulta de modo que en la ventana
se muestre(n) sólo la(s) columna(s) que se quieren
contar. (Recordar: Llegados este punto, deberíamos
haber activado ya la opción Valores únicos
y no estar utilizando aún ninguna función
de agregado).
Para activar
la opción Valores únicos: 1. Abrir
la consulta en Vista de diseño; 2. Seleccionar
la consulta haciendo un clic en cualquier sitio de la
Vista de diseño de la consulta que no sea en
la rejilla de diseño en donde se encuentra la
lista de campos; 3. Pulsar el botón propiedades
de la barra de herramientas para ver la hoja de propiedades
de la consulta; 4. Poner 'Sí' en el apartado
'Valores únicos'. Nota: cuando se activa la opción
Valores únicos, automáticamente Microsoft
Access pone 'No' en la propiedad Registros únicos.
Si los resultados de la consulta incluyen más
de un campo, para que un registro dado aparezca entre
los resultados, la combinación de los valores
de todos sus campos debe ser única; 5. Para
ver los resultados de la consulta, hacer clic en el
botón Vista de la barra de herramientas;
6. Opcional: utilizar una consulta de creación
de tablas y guardar los resultados en una nueva tabla
o exportar los datos a Excel y ponerlos en una
nueva ficha de trabajo. Guardar estos datos como archivo
.dbf.
Indicación
sobre MS Access: puede que en algunos casos sea
necesario diseñar distintas consultas para las
estadísticas de la fila Total y para las de la
cuenta. Las consultas para las tres primeras columnas
son relativamente sencillas. Las consultas para las
últimas columnas son un poco más complicadas:
requieren la construcción de expresiones que
combinen varios campos. Esto se puede llevar a cabo
creando y guardando varias tablas o, lo que es mejor,
introduciendo expresiones más complejas en el
cuadro Campo de la rejilla de diseño.
Un ejemplo de ello son las expresiones introducidas
directamente por teclado en el cuadro Campo que expresan
la adición de valores: nombre_campo1 +
nombre_campo2; su división: (nombre_campo1
+ nombre_campo2)/(nombre_campo3 + nombre_campo4);
o incluso el conjunto de expresiones anidadas en
las que se incluyen la adición, la división
y la multiplicación: ((nombre_campo1+nombre_campo2)/((nombre_campo3+nombre_campo4))*3.
Puntuación
extra: un reto mayor es realizar una consulta para
averiguar el portcentaje de familias que viven en
grupos de bloques y cuya renta media es inferior
a 15000 dólares. Una pista: cada registro representa
un grupo de bloques.
Diccionario
de datos de boston90.dbf
| BGRP |
Numero
del grupo de bloques (un dígito) |
| CONDADO |
Código
del condado |
| CDG_COD |
Código
compuesto por condado-distrito-grupo de bloques
(para el diseño de mapas) |
| DISTRITO |
Número
de distritos (longitudes del registro incoherentes) |
| DISTRITO2 |
Número
de distritos (registros de 6 dígitos de largo
-- utilizar esta columna cuando sea necesario) |
RENTA FAMILIAR
(Universo: Familias)
| HHTOTAL |
Número
total de familias |
| HHY1 |
Familias
con una renta inferior a 5000 dólares |
| HHY2 |
Familias
con una renta entre 5000 y 9999 dólares |
| HHY3 |
Familias
con una renta entre 10000 y 12499 dólares
|
| HHY4 |
Familias
con una renta entre 12500 y 14999 dólares |
| HHY5 |
Familias
con una renta entre 15000 y 17499 dólares
|
| HHY6 |
Familias
con una renta entre 17500 y 19999 dólares |
| HHY7 |
Familias
con una renta entre 20000 y 22499 dólares
|
| HHY8 |
Familias
con una renta entre 22500 y 24999 dólares |
| HHY9 |
Familias
con una renta entre 25000 y 27499 dólares
|
| HHY10 |
Familias
con una renta entre 27500 y 29999 dólares |
| HHY11 |
Familias
con una renta entre 30000 y 32499 dólares
|
| HHY12 |
Familias
con una renta entre 32500 y 34999 dólares |
| HHY13 |
Familias
con una renta entre 35000 y 37499 dólares
|
| HHY14 |
Familias
con una renta entre 37500 y 39999 dólares |
| HHY15 |
Familias
con una renta entre 40000 y 42499 dólares
|
| HHY16 |
Familias
con una renta entre 42500 y 44999 dólares |
| HHY17 |
Familias
con una renta entre 45000 y 47499 dólares
|
| HHY18 |
Familias
con una renta entre 47500 y 49999 dólares |
| HHY19 |
Familias
con una renta entre 50000 y 54999 dólares
|
| HHY20 |
Familias
con una renta entre 55000 y 59999 dólares |
| HHY21 |
Familias
con una renta entre 60000 y 74999 dólares
|
| HHY22 |
Familias
con una renta entre 75000 y 99999 dólares |
| HHY23 |
Familias
con una renta entre 100000 y 124999 dólares
|
| HHY24 |
Familias
con una renta entre 125000 y 149999 dólares |
| HHY25 |
Familias
con una renta de 150000 y superior |
RENTA MEDIA
FAMILIAR (Universo: Familias)
| MEDY
|
Renta
media familiar de cada grupo de bloques |
CÓDIGOS
CENSALES DE LOS CONDADOS DE 3 DÍGITOS
| Nombre
del condado |
Código
del condado |
| Essex |
009 |
| Middlesex |
017 |
| Norfolk |
021 |
| Plymouth |
023 |
| Suffolk |
025 |
NIVEL EDUCATIVO
(Universo: personas de 25 años o mayores)
| EDUTOTAL |
Número
total de personas de 25 años y mayores |
| EDU1 |
Por
debajo del 9º curso |
| EDU2 |
Entre
9º y 12º curso (sin diploma) |
| EDU3 |
Bachillerato
Superior (y equivalentes) |
| EDU4 |
Algunos
años de estudios universitarios (sin titulación) |
| EDU5 |
Diplomado
|
| EDU6 |
Licenciado |
| EDU7 |
Master
o Doctorado |
|