Code
# Creamos el vector con el sexo
sexo <- c("Male", "Female", "Female", "Male", "Male")June 11, 2026
June 13, 2026

Los factores son un tipo de dato estadístico usado para almacenar variables categóricas. Recordemos que estas son variables cualitativas restringidas a un determinado número de categorías.
Es necesario decirle a R que está trabajando con variables de este tipo, para que el tratamiento dado a los datos sea consistente.
Un ejemplo de este tipo de variable es el sexo, el cual está limitado a pocas clases, dependiendo de las normas culturales, variaciones cromosómicas o demás consideraciones de importancia.
Un primer paso es crear el vector que contendrá los datos que vamos a tratar como factores. Por ejemplo, el sexo de cinco individuos:
Como podemos notar, aquí hay dos niveles de factor: “Male” y “Female”. Volvemos este vector en factor con la siguiente sentencia:
Con esto podemos observar que R nos muestra los niveles de factor debajo de los valores, reconociendo que existen dos de ellos.
Hay que considerar que dentro de las variables categóricas existen dos tipos: las nominales (como la del ejemplo anterior) y las ordinales (las cuales tienen un “orden natural”). Como ejemplo de variable ordinal tenemos una escala de temperaturas que consiste de los valores “Baja”, “Media” y “Alta”. Queda claro que la “Media” está por encima de la primera, pero debajo de la última.
Con lo anterior en mente, vamos a crear un factor que contenga la escala de las temperaturas anteriores:
[1] Alta Baja Alta Baja
Levels: Baja < Media < Alta
Echémosle un vistazo al código. La función factor() puede contener más parámetros. En este caso, para indicarle a R que había orden, tenemos que hacerlo literalmente con el parámetro ordered = TRUE, mientras que dicho orden lo especificamos de manera explícita con levels = c(). Dicho orden queda confirmado tras observar la salida.
En ocasiones vamos a desear cambiar el nombre de los niveles por otros más descriptivos. Por ejemplo, en el caso del sexo, quizá nos resulte más conveniente mostrarlos en español. Esto es posible, pero debemos tener en cuenta que R asigna los niveles por orden alfabético, así que lo mejor es adelantarnos y escribir la reasignación con dicho orden en mente. Veamos cómo hacerlo:
Una función muy útil en R es summary(), la cual nos da un resumen de lo que coloquemos en ella. Veamos su salida cuando la usamos con un factor:
Es simple el resultado: da la frecuencia de cada nivel.
No tiene sentido comparar los elementos de un factor categórico nominal. Si hacemos la prueba con sexo_factor R nos avisa precisamente eso.
La cosa cambia cuando queremos comparar factores con niveles ordenados:
Bien, hemos terminado de momento con los factores. En posteriores entradas veremos más elementos en R.