Por Claudio Gutiérrez, Depto. Ciencias de la Computación, FCFM, Universidad de Chile.
Permítanme comenzar con un ejemplo simple. Hace algún tiempo leí un artículo que hablaba del sesgo social que significaban los apellidos en Chile. Sostenía, por ejemplo, que al momento de buscar trabajo, ser “Larraín” es sustancialmente diferente de ser “González”. En la misma línea, podemos especular que no es mera coincidencia que hayan dos senadores y un ministro “Larraín” y ningún “González”. Miremos los datos.
Los datos publicados por el Registro Civil indican que “González” es el apellido más común en Chile: aproximadamente un 5% de los chilenos lo tiene. Siendo el apellido una etiqueta que se le adosa a un ser humano y no una expresión intrínseca de sus capacidades, uno hipotetizaría que si no hay discriminación, cualquier grupo humano elegido al azar en Chile, debiera tener aproximadamente un 5% de personas con apellido “González”. Como el día de nacimiento: como hay tantos días pares como impares, uno esperaría que en todo grupo humano, debiera haber aproximadamente un 50% de gente cuyo día de nacimiento es par. Podemos hipotetizar que hay aproximadamente tantos senadores nacidos en días pares como impares (ejercicio: busque los datos para probarlo; son públicos).
Hice otro breve ejercicio con datos de la academia. La página de Transparencia de la Universidad de Chile permite a cualquier persona obtener la lista de todos sus profesores (no es sencillo o simplemente imposible obtener esa lista de universidades que no tienen “transparencia”, por ejemplo, todas las privadas). Después de un necesario procesamiento (ya hablaré de esto), los datos indican que 50 sobre el total de 1.390 profesores de jornada completa en la Universidad de Chile llevan el apellido “González”, esto es un 3,6 %. Hice el mismo ejercicio con la Facultad de Economía y Negocios. Resultado: 2 de un total de 81 profesores llevan el apellido “González”, esto es un 2,5 %. Finalmente, miré los profesores de la Facultad de Ciencias Económicas y Empresariales de la Universidad Los Andes: ninguno de los 159 profesores llevan el apellido “González”, esto es, el 0 %.
Esos son los datos. Están ahí. No se procesan solos ni “hablan por sí mismos” (como muchos nos quisieran hacer creer). Un humano los procesa, los interpreta y los hace hablar. Veamos esas etapas en nuestro ejemplo:
1) Cómo obtenerlos y procesarlos. Obtener estos datos no fue sencillo. Aunque son públicos, los mismos datos (lista de profesores) no tienen el mismo formato ni la misma estructura en diferentes organizaciones. Esto es normal. Quien quiera trabajar con datos debe aprender a buscarlos. Y luego, procesarlos. Por ejemplo, la lista de profesores de la Universidad de Chile aparece junto a la de funcionarios en un gigantesco archivo en formato pdf. Para contar el número de profesores de apellido “González”, hubo que transformar el archivo pdf a texto (sencillo: la herramienta pdftotext). Pero luego (esto es menos sencillo) usar algún programa (por ejemplo en perl) o herramienta (awk para los más rudos) para filtrar y contar lo que se necesitaba. Moraleja 1: Programar es tan importante como la lectura o la escritura hoy día.
2) Cómo interpretarlos. ¿Qué conclusiones podemos sacar de nuestro ejemplo de juguete? Que en la actividad académica hay sesgo hacia algunos apellidos: de 5% en la población general, baja a 3.6% en los académicos de la Universidad de Chile, a 2,5% en Economía, y a 0% en Economía de Los Andes. ¿Son significativos estos datos? Hay varias sutilezas que sortear. Para sistematizar estas intuiciones, uno necesita herramientas metodológicas y conceptuales de las Ciencias Sociales (sociología, historia, economía, educación, etc.) En este caso, de las relaciones entre los individuos y los grupos sociales en un país como Chile. Moraleja 2: las Ciencias Sociales no son prescindibles –como ciertos tecnócratas nos quieren convencer–, sino que son cruciales para entender los datos.
3) Cómo presentar y visualizar datos. Finalmente cómo presentamos nuestros hallazgos. Esto es un arte. Los autores del artículo al que hacía referencia al comienzo presentaron su estudio así: “Dime cómo te llamas y te diré quién eres”, que expone sus conclusiones de manera simple y elocuente. Uno también podría graficar los datos para hacerlos más atractivos. Pero no se trata sólo de mostrarlos de manera “sexy”, entretenida, que “enganchen” a quien queremos convencer. También debemos presentar los datos de tal forma que otros pudieran repetir el experimento o “mirar” esos mismos datos bajo otra óptica. Moraleja 3: no basta saber Matemáticas, Computación o Ciencias Sociales. Hay que tener también arte para comunicar y ciencia para exponer los datos.
Tradicionalmente, se espera que estas actividades, cada una por separado en estancos compartimentados, sean desarrolladas por técnicos: estadísticos, informáticos, sociólogos, analistas, y periodistas y publicistas. Sostengo que hoy día, en una época en que los datos son no sólo cada vez más accesibles y públicos, sino que son parte de nuestra vida diaria, todas éstas debieran ser herramientas básicas del ciudadano común, y ser manejadas en su interrelación. Es un tremendo desafío para quienes trabajamos con datos el generar herramientas amigables para todos, el enseñar a todos su uso y sus alcances. Un gran desafío educar a la gente para que aprenda a interpretar los datos, en particular entregar los conceptos básicos de ciencias sociales. Y aprender a presentar y visualizar los datos, esto es, a comunicarlos y publicitarlos.
Así, con una educación digna, cada uno podría sacar sus propias conclusiones sobre por qué en altas esferas de Gobierno hay tanto “Larraín” y tan pocos “González”. Entenderíamos así por qué Los Prisioneros cantaban “si tu apellido no es González ni Tapia”…
El blog Bits, Ciencia y Sociedad de la sección de Tecnología de Terra es un espacio donde académicos del Departamento de Ciencias de la Computación de la Universidad de Chile hablarán de la Tecnología y su impacto político y social en nuestro país.
Es fascinante como por medio de un sencillo artículo aparece desde atrás una buena crítica a la distribución la cual ya no es solamente económica, sino que también, social. Excelente manera de llegar al tema, decirlo sin decirlo… buena pluma..
felicitaciones…
ahhh voy a utilizar tu columna para una clase de ciencias sociales.. (no te molesta verdad)
muchas gracias!!1
Gran posteo, las claves: extracción, análisis y síntesis. Yo hice un ejercicio hace poco tiempo con datos públicos del INE y del Servel, para argumentar porqué el gobierno, y el estado en general no prestaba atención a las demandas que por años han tenido los habitantes de Aysén.
¡Excelente su artículo, estimado Tocayo!!
Muy claro, directo y didáctico.
Gracias estimado.