Antes de leer los datos en R, se pueden ver en Excel o en un editor de texto. (a) Use la funcin read.csv() para leer los datos en R. Llame al colegio de datos cargado. Asegrese de tener el directorio configurado en la ubicacin correcta para los datos. (b) Mire los datos usando la funcin fix(). Debe notar que la primera columna es solo el nombre de cada universidad. Realmente no queremos que R trate esto como datos. Sin embargo, puede ser til tener estos nombres para ms adelante. Pruebe los siguientes comandos: 2.4 Ejercicios 55 (c) > rownames(college)=college[,1] > fix(college) Debera ver que ahora hay una columna row.names con el nombre de cada universidad registrada. Esto significa que R le ha dado a cada fila un nombre correspondiente a la universidad apropiada. R no intentar realizar clculos en los nombres de las filas. Sin embargo, todava necesitamos eliminar la primera columna en los datos donde se almacenan los nombres. Prueba > college=college[,-1] > fix(college) Ahora deberas ver que la primera columna de datos es Privada. Tenga en cuenta que ahora aparece otra columna con la etiqueta row.names antes de la columna Private. Sin embargo, esta no es una columna de datos, sino el nombre que R le da a cada fila. i. Utilice la funcin summary() para producir un resumen numrico de las variables en el conjunto de datos. ii. Use la funcin pairs() para producir una matriz de diagrama de dispersin de las primeras diez columnas o variables de los datos. Recuerde que puede hacer referencia a las primeras diez columnas de una matriz A usando A[,1:10]. iii. Use la funcin plot() para producir diagramas de caja uno al lado del otro de Outstate versus Private. IV. Cree una nueva variable cualitativa, denominada Elite, agrupando la variable Top10perc. Vamos a dividir las universidades en dos grupos en funcin de si la proporcin de estudiantes que provienen del 10% superior de sus clases de secundaria supera o no el 50%. > Elite=rep("No",nrow(college)) > Elite[college$Top10perc >50]="Yes" > Elite=as.factor(Elite) > college=data.frame(college ,Elite) Use el resumen () funcin para ver cuntas universidades de lite hay. Ahora use la funcin plot() para producir diagramas de caja uno al lado del otro de Outstate versus Elite. v. Use la funcin hist() para producir algunos histogramas con diferentes nmeros de intervalos para algunas de las variables cuantitativas. Puede encontrar til el comando par(mfrow=c(2,2)): dividir la ventana de impresin en cuatro regiones para que se puedan hacer cuatro grficos simultneamente. Modificar los argumentos de esta funcin dividir la pantalla de otras formas. vi. Contine explorando los datos y proporcione un breve resumen de lo que descubra..