1 de junio de 2009

Los niveles de medición desde la práctica de investigación – Nominal, Ordinal, Intervalo y Razón

Cuando se trata de definir la estructura de cada pregunta de un cuestionario, uno de los principales problemas consiste en definir el nivel de medición, el poder y potencial estadístico de cada una.

Esto es particularmente cierto para personas que apenas incursionan en la redacción de cuestionarios, y también tiene repercusiones interesantes cuando se trata de la planeación analítica de la información, esto es, el tipo de análisis y pruebas estadísticas o de observación que se esperan realizar a través del instrumento.

Documentación sobre los niveles de medición y características de los mismos se pueden encontrar fácilmente en la web. Sin embargo y para muchos neófitos (y no tan neófitos) en materia, continúan los problemas para asimilar la mejor forma de aplicar, y sobre todo elegir, el nivel de medición idóneo. Razón por la cual, el presente artículo pretende ser una pequeña guía práctica sobre definiciones, casos y aplicaciones de los niveles de medición existentes para la Investigación cuantitativa.


Generalidades
Un nivel de medición se refiere a la estructura interna de una pieza de información, determinado por la forma en que se obtiene esta información – la pregunta que se hace para obtenerla.
Tenemos que, en la fundamentación teórica, se identifican cuatro niveles básicos de medición: Nominal, Ordinal, Intervalo y Razón. Estos niveles difieren fundamentalmente en la naturaleza de los datos que soportan, y más profundamente en las aplicaciones matemáticas que permiten. Son unilateralmente inclusivos, es decir que mientras más complejo sea el nivel de medición elegido, éste incorpora las características de los niveles menos complejos.
Para efectos conceptuales, es importante definir la diferencia entre una variable y una categoría. Una Variable es la característica que se pretende medir, y sus Categorías son las diferentes opciones de respuesta posibles, ya sea que se definan a priori o no. A modo de ejemplo, la variable “Estado Civil”, usualmente contiene las categorías “Casado, Soltero, Unión Libre, Divorciado o Viudo”.
Hacemos una descripción breve de cada uno sólo para dar contexto a los ejemplos por venir:

Nominal – Este nivel de medición produce datos que no implican un orden empírico. Las categorías en las preguntas de este nivel son independientes entre sí, y por tanto la elección de uno no tiene mayor valor intrínseco que otro.
Buena parte de las preguntas comunes en investigación son de carácter nominal. Un ejemplo común de esto es la determinación del Género, donde la elección entre sus dos posibles categorías (Masculino, Femenino) no determina mayor o menor valor. Ser hombre no genera un valor intrínseco más alto o bajo que ser mujer, por lo que son categorías imponderables.
Las preguntas que se usan en la determinación de proporciones de mercado (Market Share), posicionamiento único (Top of Mind) o compartido (Share of Mind), o la asociación de conceptos con productos y servicios (comúnmente, los mapas perceptuales) son todos ejemplos de análisis poderosos y frecuentes que se obtienen a través de niveles nominales de medición. Una característica importante en el nivel nominal es la Identificación, es decir, la capacidad de cada categoría de ser heterogénea y exhaustiva contra sus compañeras. Así, para la variable “Marcas de cerveza”, sus categorías “Marca X, Marca Y,… etc.” deben en todo momento ser únicas, y no tener características en común.
Una ventaja importante en las variables nominales, es que se pueden codificar las variables (convertir las opciones de respuesta en números) sin que esto altere de ninguna manera los valores. Puedo asignar el número 1 a Masculino y el 2 a Femenino, o viceversa, sin que haya orden alguno.
Su principal desventaja es la ausencia de poder estadístico para pruebas paramétricas. Técnicamente hablando, las únicas estadísticas que admite este nivel de medición son Frecuencias, Moda y pruebas no paramétricas de significación como Chi cuadrado.

Ordinal – Este nivel de medición produce datos cuyas categorías tienen un orden empírico. La relación en este caso es dependiente de una sola vía. Aún así, no se sabe la distancia exacta entre cada una de las categorías, por lo que es imposible definir la dirección y potencia entre rangos.
Las variables de nivel ordinal te permiten, como es deducible, ordenar las categorías desde el valor más alto al valor más bajo, dando un sentido más profundo en la interrelación de los datos que las variables nominales. Un tipo de pregunta que se creó precisamente conforme a las características del nivel ordinal se llama Ranking.
Los Rankings son de los efectos más útiles cuando se trata de otorgar niveles de importancia a datos categóricos (expresados en palabras). También son populares debido a que están en sintonía con la tendencia natural que tenemos los humanos de atribuir valor subjetivo a las cosas y situaciones que vivimos. Si lo vemos desde una perspectiva deportiva, al término de una competencia de caballos de carreras existirá siempre el “primero, segundo y tercer lugar”. Lo interesante en este caso, es que para esta catalogación no importa si la diferencia entre el primero y el segundo fue de una nariz, una cabeza o un cuerpo.
Una variable ordinal se suele definir con categorías expresadas en datos numéricos (del 1 al 10, 1° 2° y 3°, etc.), aunque también se suelen configurar en función de datos categóricos como en el ejemplo del siguiente párrafo. Su problema radica en que, al no saber la distancia entre cada categoría de respuesta, hay ciertos análisis matemáticos que no son factibles.
Un problema típico en la interpretación de variables de nivel ordinal son las frecuencias de uso determinadas por rangos verbales. “Siempre, Frecuentemente, Algunas veces, Rara vez y Nunca” son categorías frecuentemente usadas en esta variable. Sabemos que “Siempre” tiene más valor que “Frecuentemente” cuando hablamos de frecuencia de uso / visita / acción; lo que no sabemos es cuál es el valor del rango entre ambas, pues “frecuentemente” podría significar en la psique del consumidor “5 o 6 veces a la semana” o “3 o 4 veces al mes”.
Además, el valor de “Siempre” puede también estar determinado por un factor externo. Sabemos que es una relación de 100% de las ocasiones, pero las ocasiones en sí mismas pueden variar. Supongamos que aplicamos esta escala para saber qué tan frecuentemente nuestro sujeto lee el periódico vespertino. “Siempre” podrá significar “Todos los días”. Por otro lado si aplicamos la escala para saber qué tan frecuente es que el sujeto acuda a los conciertos que ofrece su grupo favorito en la ciudad, es más probable que el “Siempre” sea interpretado como “Siempre que vienen a la ciudad”. Si el grupo acude a la ciudad una vez cada seis meses, el “siempre” tiene una frecuencia real de “una vez cada seis meses”.
Todo lo anterior ocasiona que sea realmente complicado obtener medidas de tendencia central y dispersión como Medias, Desviaciones Estándar y Varianza; además que veta todas las pruebas paramétricas conocidas. Es común la conversión de valores ordinales a intervalo para un mayor poder estadístico. Sin embargo se debe poner gran cuidado en que, en la codificación, la distancia entre categorías respete el orden empírico del que provienen.

De Intervalo – Este nivel de medición produce datos cuyas categorías tienen un orden constante. En este caso, la distancia entre categorías es medible, idéntica y continua entre cada una, por lo que se puede determinar dirección y potencia de la variable.
Todo dato que sea una cantidad específica, producto de una ponderación o cuantificación, es un dato de intervalo. La medición de la temperatura y los Ratings son los ejemplos más usuales de este tipo de nivel de medición.
Una interpretación tradicionalmente aceptada de la diferencia entre niveles ordinal e intervalo es la posibilidad de aceptar valores decimales en el segundo. Esto está probado como falso, pues es factible determinar rangos decimales sin ser necesariamente idénticos en distancia. Para ejemplificar, si defino los rangos “de 1 a 3 libras, de 3.1 a 5 libras, de 5.1 a 10 libras y más de 10 libras”; la conversión a kilogramos sería “de 0.4 a 1.2 kilogramos, de 1.3 a 2.3 kilogramos, de 2.4 a 4.5 kilogramos y más de 4.5 kilogramos”. Aún se trata de rangos no equivalentes, con todo y decimales.
Los ratings quizá sean la definición más profunda y detallada de una variable de Intervalo, debido a que se trata de calificaciones otorgadas a determinados valores o situaciones. Difieren totalmente de los rankings en el sentido de que en los primeros se sabe con certeza la distancia entre categorías, al estar sujetos a un criterio numérico constante.
La mayoría de (si no todas) las encuestas de satisfacción del cliente están construidas en formato de ratings. Se propone una característica a evaluar, digamos “atención y amabilidad”, y se pide otorgan una calificación en un rango fijo, digamos entre 5 y 10, siendo 5 la peor calificación y 10 la mejor. Esta construcción es muy versátil, y da libertad para realizar análisis estadísticos potentes y una buena diversidad de pruebas paramétricas.
Su debilidad radica en que no existe el valor de ausencia del atributo, es decir, el cero “0” absoluto. Al no existir el cero absoluto, no hay manera que calcular ratios de incremento o decremento del valor, pues si cambiáramos la nomenclatura base las distancias no serían en la misma proporción de equivalencia.
Para explicar la equivalencia, hablemos del ejemplo más usual, la temperatura. En la cultura latina usamos la graduación Celsius. Sabemos que, bajo ciertas condiciones de altitud y presión, el agua congela a cero grados Celsius. Pero 0 grados no implica la ausencia de la propiedad, sólo significa un valor de escala que denota la congelación. Si esto se tradujera a grados Fahrenheit, el agua congelaría a 36 grados.
La ausencia del cero absoluto tiene otras repercusiones más profundas en cuanto a la equivalencia de las escalas. Explicamos esto con otro ejemplo. Normalmente, la gente mexicana califica más adecuadamente cuando le damos un rango de elección del 5 al 10, en vez del 1 al 10. Esto se debe a que la escala 5 a 10 es la que aprendemos a interpretar desde nuestros años de escuela, y nos han enseñado que 5 es la calificación más baja, y todo número bajo el 5 no aporta mayor o menor valor o injerencia.
Si quisiéramos comparar los resultados de la misma escala con las respuestas de alemanes, por ejemplo, deberíamos considerar que su escala de calificación educativa va del 1 al 7, siendo 7 la calificación más alta. Por lo tanto difícilmente veríamos alguna relación de coherencia entre la información, pues las calificaciones están juzgadas bajo contextos diferentes. Por tanto, sus “ceros” no tienen el mismo valor.

De razón – Tiene las mismas exactas características que el nivel de Intervalo, con la adición de que posee un valor cero “0” absoluto, por lo que se trata del nivel de medición más puro matemáticamente hablando.
Una escala de razón tiene la principal virtud de ser equivalente a cualquier otra escala basada en nomenclatura diferente, siempre que se respeten los rangos entre categorías. El peso siempre tiene el mismo equivalente entre nomenclaturas, por tanto 0 kilogramos es igual que 0 libras, y sabemos que la distancia entre 1 y 2 kilogramos es exactamente la misma que entre 2.2 y 4.4 libras.
La edad en valores absolutos, el salario promedio mensual, y el tiempo; son todos ejemplos de escalas de razón. Una escala de razón tiene el potencial estadístico más fuerte, y puede soportar cualquier proceso matemático y toda prueba paramétrica.

Del juego del cambio
El camino correcto para elegir el nivel de medición de las variables, y por tanto la forma en que se configuren preguntas y escalas de respuesta, tiene que ver directamente con el diseño de investigación. En concreto, con los modelos univariables y multivariables que se pretenden desarrollar en la búsqueda de una tendencia de datos.
Ejemplos rápidos pueden ser:
Análisis de Correspondencias y Mapas Perceptuales, para determinar asociaciones de conceptos y atributos con productos y servicios que los contienen. Este análisis requiere Niveles Nominales para su cómputo.
Análisis de Conglomerados (Clusters), para la segmentación de mercados, perfilamiento de clientes y reducción de variables explicativas. Este análisis funciona mejor con niveles de Intervalo, pero pueden funcionar positivamente con niveles ordinales.
Análisis Factorial por Componentes Principales, para la reducción de variables explicativas. Requiere de niveles ordinales de los datos.
Modelos de Elección Discreta o CBC (Choice based Conjoint), para la predicción de elecciones de valor. Para que esta prueba trabaje, requerirá niveles de intervalo.
Modelos de regresión simple y múltiple, para la predicción de variables dependientes. Utiliza cualquier tipo de variables - siempre y cuando sean numéricas -, aunque funciona más efectivamente con variables independientes de razón.
A veces, se tiende a convertir o codificar los datos para adaptarlos a ciertos niveles de medición. Por ejemplo, se suelen juntar las edades específicas en grupos de edad para facilitar una tabulación cruzada, en cuyo caso se están convirtiendo niveles de razón a niveles ordinales. Por el contrario, a niveles nominales se les puede atribuir valor empírico, convirtiéndolas en ordinales.
Esta práctica es válida, siempre y cuando se sigan los siguientes criterios:
• Se pueden convertir variables nominales a ordinales asignando un valor, pero este criterio de valor deberá mantenerse constante durante todo el estudio donde haya injerencia de estos datos.
• Al convertir niveles ordinales o cambiar su codificación, el nuevo criterio deberá mantener el orden empírico original.
• Al convertir niveles de intervalo, se debe cuidar que el orden y la distancia entre rangos sea en igual equivalencia.
• En muy pocas ocasiones es posible cambiar el criterio de un nivel de razón, a menos que todas sus propiedades se mantengan intactas en la nueva nomenclatura.
Para cerrar, presento una tabla resumen de la naturaleza, características, posibilidades de análisis y conversión de cada uno de los niveles de medición. Espero sea de amplia utilidad al lector. (Para mejor lectura, dar click en la imagen)

1 comentario:

  1. Esta completisima la informacion, soy alumna de Comunicacion y Periodismo y les agradesco subir a la red informacion util.

    ResponderEliminar