Introducción a R
La vida es una toma
de decisiones constante. Tenemos que decidir entre un tratamiento con un
fármaco determinado u otro, o entre dos sistemas de nutrición o entre dos
niveles de lisina. Todo son toma de decisiones. Y no queremos errar en la
decisión. Pero, ¿qué circunstancias son las que nos hacen tomar una decisión u
otra? ¿En qué nos basamos ? ¿Con qué probabilidad de acierto tomamos esa
decisión?. Muchas de las decisiones de nuestra vida profesional las tomamos “porque me parece” o
“porque creo que”. ¿No es un poco ilógico que en pleno siglo XXI tomemos
decisiones basadas en creencias y no apoyando nuestra decisión en un
razonamiento basado en hechos y en datos que nos den unas probabilidades de
acertar en nuestra decisión?.
Teniendo en
mente la toma de decisiones basadas en
datos, nos gustaría, ayudar a todos
aquellos que quieran aprender técnicas para tomar decisiones con la más alta
probabilidad posible de acertar. Para ello vamos a utilizar las mejores
herramientas de las que disponemos hoy en día en la toma de decisiones basadas
en datos, los programas informáticos creados para ser utilizados en ordenadores
personales.
Queremos
presentarles a R.
¿Qué es R? R es una aplicación informática de libre
distribución, gratuita con versiones para Windows, Mac OS X y Linux creada a finales de los años 90 y clónica del
paquete no gratuito S-Plus que es un compendio de aplicaciones estadísticas. R
son las iniciales de dos profesores de la Universidad de Auckland, Nueva
Zelanda, Ross Ihaka y Robert Gentleman,
que a partir de S-Plus (desarrollado por AT$T's Bell Laboratories) hicieron una
plataforma para usar en tareas docentes. A partir de 1995 dicha plataforma se
convirtió en una aplicación estadística de distribución gratuita.
R no es un programa
de estadística como otros tanto para
estadística como para otras
aplicaciones. R es una herramienta gigantesca y poderosa con muchas
aplicaciones diversas de todos los campos de la ciencia y con un enorme número
de funciones gráficas disponibles. En los últimos recuentos, se han descrito
más de 50.000 diferentes funciones que hacen de R uno de los más gigantescos
desarrollos actualmente realizados por la comunidad científica mundial.
Pero para no aburrirles comenzaremos con descargarnos el
programa, instalarlo en nuestro ordenador y comenzar a interactuar con alguna
de sus múltiples aplicaciones que podrán utilizar rápidamente en su labor cotidiana.
INSTALACIÓN DE R
Primero empezamos descargando R.
Nosostos utilizaremos la version para Windows para esta introducción a R, asi que descargamos la versión que pone:
Si utiliza otro sistema operativo descarge el que usted utilice.
En la siguiente
pantalla, clicar sobre:
install Rfor the first time (instalar R por primera vez)
y en la siguiente
pantalla, clicar sobre:
Una vez descargado
el paquete en el directorio elegido en nuestro ordenador, haremos doble clic
sobre el fichero descargado y R quedará instalado en nuestro ordenador.
Una vez instalado,
su ejecución es como la de cualquier otro programa, doble (o simple) clic sobre
R y aparecerá la pantalla inicial de R.
NUESTRA PRIMERA EXPERIENCIA CON R
Nuestra primera
experiencia con R va a ser para demostrar la potencia gráfica y la facilidad de
uso del paquete; nos gustaría que este primer contacto atraiga su atención. Lo
que vamos a hacer con este código que vamos a proporcionar a continuación es
generar tres gráficos en uno. En el eje de abcisas o eje X vamos a tener la
variable “Coste de un kg de pienso” y en el eje de ordenadas o eje Y pondremos
la variable “Índice de conversión”. Con ambas variables dibujaremos un gráfico
de dispersión, y a la vez tendremos el diagrama de caja (boxplot) de cada una
de ellas.
En primer lugar, hay
que abrir R como cualquier otro programa (en Windows desde el menú de inicio o
el icono que se ha instalado en el escritorio) y una vez abierto, en la
pantalla que aparece al lado del signo de R que es “>”, hay que introducir
el siguiente código (atención: R es muy sensible y requiere todos los signos
que aparecen en el código, paréntesis, comas, mayúsculas y minúsculas).
Las líneas que
comienzan con # son explicaciones de lo que hace R y no hace falta copiarlas,
aunque si se incluyen tal y como están no pasa nada (el símbolo # delante de
una línea le indica a R que el texto que hay a continuación es un comentario):
ic<-c(2.90, 2.82, 2.56, 2.78, 2.98, 3.01) #cargamos los datos del índice de conversión de 6 granjas de cerdos cos<-c(38.50, 38.75, 41.00, 41.03, 40.00, 35.40) #cargamos el coste por kg de pienso de cada una de las granjas anteriores en el mismo #orden opar<-par(no.readonly=TRUE) #le decimos a R que vamos a modificar las características de la creación de gráficos, par(fig=c(0, 0.8, 0, 0.8)) #donde queremos el gráfico principal, plot(cos, ic, xlab="Coste de un kg de pienso", ylab="Indice de conversión") #le decimos que construya un gráfico con la variable “cos” en ordenadas y la variable “ic” #en abcisas par(fig=c(0, 0.8, 0.55, 1), new=TRUE) #dónde queremos el gráfico boxplot, sobre el gráfico, boxplot(cos, horizontal=TRUE, axes=FALSE) #que dibuje el boxplot con la variable cos,, par(fig=c(0.65, 1, 0, 0.8), new=TRUE) #dónde queremos el boxplot, en el lateral del gráfico, boxplot(ic, axes=FALSE) #que dibuje el boxplot con la variable ic, mtext("Scatterplot mejorado", side=3, outer=TRUE, line=-3) #que inserte la leyenda y dónde par(opar) #que hemos terminado de definir las características del gráfico.
Una vez terminada
esta operación, obtendremos el gráfico de esta página. ¿Podrían hacerlo tan
rápido con otro tipo de programa?
Para cerrar R hay que
escribir:
q()
indicándole que no
queremos guardar el área de trabajo
En 49 palabras y 424
caracteres hemos creado un gráfico profesional difícilmente asequible con
herramientas como Excel u otras. Pero no hay que asustarse, que no hay que
aprender a programar ni nada por el estilo para sacarle un increíble partido al
uso de R. Lo veremos en las siguientes
entradas.
Pueden visitar la
web de R en http://cran.r-project.orgy descargar mucha más información,
archivos
de ayuda o incluso
manuales de instalación, uso y estadística. Es aconsejable descargar un pdf muy
Comentarios
Publicar un comentario