🗊Презентация Основы R2. Тема 1

Нажмите для полного просмотра!
Основы R2. Тема 1, слайд №1Основы R2. Тема 1, слайд №2Основы R2. Тема 1, слайд №3Основы R2. Тема 1, слайд №4Основы R2. Тема 1, слайд №5Основы R2. Тема 1, слайд №6Основы R2. Тема 1, слайд №7Основы R2. Тема 1, слайд №8Основы R2. Тема 1, слайд №9Основы R2. Тема 1, слайд №10Основы R2. Тема 1, слайд №11Основы R2. Тема 1, слайд №12Основы R2. Тема 1, слайд №13Основы R2. Тема 1, слайд №14Основы R2. Тема 1, слайд №15Основы R2. Тема 1, слайд №16Основы R2. Тема 1, слайд №17Основы R2. Тема 1, слайд №18Основы R2. Тема 1, слайд №19Основы R2. Тема 1, слайд №20Основы R2. Тема 1, слайд №21Основы R2. Тема 1, слайд №22Основы R2. Тема 1, слайд №23Основы R2. Тема 1, слайд №24Основы R2. Тема 1, слайд №25Основы R2. Тема 1, слайд №26Основы R2. Тема 1, слайд №27Основы R2. Тема 1, слайд №28Основы R2. Тема 1, слайд №29Основы R2. Тема 1, слайд №30Основы R2. Тема 1, слайд №31Основы R2. Тема 1, слайд №32Основы R2. Тема 1, слайд №33Основы R2. Тема 1, слайд №34Основы R2. Тема 1, слайд №35Основы R2. Тема 1, слайд №36Основы R2. Тема 1, слайд №37Основы R2. Тема 1, слайд №38Основы R2. Тема 1, слайд №39Основы R2. Тема 1, слайд №40Основы R2. Тема 1, слайд №41Основы R2. Тема 1, слайд №42Основы R2. Тема 1, слайд №43Основы R2. Тема 1, слайд №44Основы R2. Тема 1, слайд №45Основы R2. Тема 1, слайд №46Основы R2. Тема 1, слайд №47Основы R2. Тема 1, слайд №48Основы R2. Тема 1, слайд №49Основы R2. Тема 1, слайд №50Основы R2. Тема 1, слайд №51Основы R2. Тема 1, слайд №52Основы R2. Тема 1, слайд №53Основы R2. Тема 1, слайд №54Основы R2. Тема 1, слайд №55Основы R2. Тема 1, слайд №56Основы R2. Тема 1, слайд №57Основы R2. Тема 1, слайд №58Основы R2. Тема 1, слайд №59Основы R2. Тема 1, слайд №60Основы R2. Тема 1, слайд №61Основы R2. Тема 1, слайд №62Основы R2. Тема 1, слайд №63Основы R2. Тема 1, слайд №64Основы R2. Тема 1, слайд №65Основы R2. Тема 1, слайд №66Основы R2. Тема 1, слайд №67Основы R2. Тема 1, слайд №68Основы R2. Тема 1, слайд №69Основы R2. Тема 1, слайд №70Основы R2. Тема 1, слайд №71Основы R2. Тема 1, слайд №72Основы R2. Тема 1, слайд №73

Содержание

Вы можете ознакомиться и скачать презентацию на тему Основы R2. Тема 1. Доклад-сообщение содержит 73 слайдов. Презентации для любого класса можно скачать бесплатно. Если материал и наш сайт презентаций Mypresentation Вам понравились – поделитесь им с друзьями с помощью социальных кнопок и добавьте в закладки в своем браузере.

Слайды и текст этой презентации


Слайд 1





Тема 1: Основы R
Описание слайда:
Тема 1: Основы R

Слайд 2





Содержание
Преимущества R
Список литературы
Обзор возможностей R
Интерфейс R
Рабочая среда R
Помощь R
Пакеты R
Сохранение результатов
Использование результатов
Описание слайда:
Содержание Преимущества R Список литературы Обзор возможностей R Интерфейс R Рабочая среда R Помощь R Пакеты R Сохранение результатов Использование результатов

Слайд 3





Преимущества R

Бесплатное программное обеспечение
Доступно на Windows, Unix, Mac OS
Широкие возможности проведения статистического анализа (в т.ч. методы, недоступные в других пакетах)
Интуитивно понятный объектно- ориентированный язык высокого уровня
Широкие возможности графической визуализации результатов анализа
Описание слайда:
Преимущества R Бесплатное программное обеспечение Доступно на Windows, Unix, Mac OS Широкие возможности проведения статистического анализа (в т.ч. методы, недоступные в других пакетах) Интуитивно понятный объектно- ориентированный язык высокого уровня Широкие возможности графической визуализации результатов анализа

Слайд 4





Список литературы
Each of the following tutorials are in PDF format.
P. Kuhnert & B. Venables, An Introduction to R: Software for Statistical Modeling & Computing 
J.H. Maindonald, Using R for Data Analysis and Graphics 
B. Muenchen, R for SAS and SPSS Users 
W.J. Owen, The R Guide 
D. Rossiter, Introduction to the R Project for Statistical Computing for Use at the ITC 
W.N. Venebles & D. M. Smith, An Introduction to R
Описание слайда:
Список литературы Each of the following tutorials are in PDF format. P. Kuhnert & B. Venables, An Introduction to R: Software for Statistical Modeling & Computing J.H. Maindonald, Using R for Data Analysis and Graphics B. Muenchen, R for SAS and SPSS Users W.J. Owen, The R Guide D. Rossiter, Introduction to the R Project for Statistical Computing for Use at the ITC W.N. Venebles & D. M. Smith, An Introduction to R

Слайд 5





Список литературы
Paul Geissler's excellent R tutorial 
Excellent Tutorials by David Rossitier 
Excellent tutorial an nearly every aspect of R (c/o Rob Kabacoff)
Introduction to R by Vincent Zoonekynd 
R Cookbook
The Art of R
Описание слайда:
Список литературы Paul Geissler's excellent R tutorial Excellent Tutorials by David Rossitier Excellent tutorial an nearly every aspect of R (c/o Rob Kabacoff) Introduction to R by Vincent Zoonekynd R Cookbook The Art of R

Слайд 6





Список литературы
R Concepts and Data Types presentation by Deepayan Sarkar 
The R Wiki 
An Introduction to R 
A Handbook of Statistical Analyses Using R(Brian S. Everitt and Torsten Hothorn)
Описание слайда:
Список литературы R Concepts and Data Types presentation by Deepayan Sarkar The R Wiki An Introduction to R A Handbook of Statistical Analyses Using R(Brian S. Everitt and Torsten Hothorn)

Слайд 7





Обзор возможностей R
Можно вводить команды одну за другой в командной строке (>) или запустить последовательность команд из файла-источника
Язык R содержит огромное количество различных типов данных, включая векторы (числовые, строковые, логические), матрицы, блоки данных и списки (vector, matrix, data.frame, list)
Для выхода из R достаточно ввести команду
>q()
Описание слайда:
Обзор возможностей R Можно вводить команды одну за другой в командной строке (>) или запустить последовательность команд из файла-источника Язык R содержит огромное количество различных типов данных, включая векторы (числовые, строковые, логические), матрицы, блоки данных и списки (vector, matrix, data.frame, list) Для выхода из R достаточно ввести команду >q()

Слайд 8





Обзор возможностей R
Гибкость языка R обеспечивается посредством встроенных и пользовательских функций. Во время работы с R все пользовательские данные хранятся в памяти программы
Базовые функции доступны по умолчанию. Другие функции содержатся в особых статистических пакетах и могут быть загружены во время работы
Описание слайда:
Обзор возможностей R Гибкость языка R обеспечивается посредством встроенных и пользовательских функций. Во время работы с R все пользовательские данные хранятся в памяти программы Базовые функции доступны по умолчанию. Другие функции содержатся в особых статистических пакетах и могут быть загружены во время работы

Слайд 9





Обзор возможностей R
Основным навыком программирования в R является умение использовать встроенную справочную систему.
Фундаментальным свойством языка R является тот факт, что выходные данные одного объекта могут использоваться в качестве входных данных для другого.
Описание слайда:
Обзор возможностей R Основным навыком программирования в R является умение использовать встроенную справочную систему. Фундаментальным свойством языка R является тот факт, что выходные данные одного объекта могут использоваться в качестве входных данных для другого.

Слайд 10





Интерфейс R
Описание слайда:
Интерфейс R

Слайд 11





Введение в R
Результаты вычислений могут храниться в различных объектах с использованием операторов присвоения:
 Стрелка (<-)
 Знак равенства (=).
Описание слайда:
Введение в R Результаты вычислений могут храниться в различных объектах с использованием операторов присвоения: Стрелка (<-) Знак равенства (=).

Слайд 12





Введение в R
Объекты R могут использоваться в последовательных расчетах. Для того, чтобы обратиться к объекту, необходимо напечатать в рабочей области имя объекта
Требования к имени объекта
 Имя объекта не может содержать символы !, +, -, #
 Точка (.) и подстрочное подчеркивание (_) разрешены
 Имя объекта может содержать число, но не может начинаться с числа
 Язык R чувствителен к регистру
Описание слайда:
Введение в R Объекты R могут использоваться в последовательных расчетах. Для того, чтобы обратиться к объекту, необходимо напечатать в рабочей области имя объекта Требования к имени объекта Имя объекта не может содержать символы !, +, -, # Точка (.) и подстрочное подчеркивание (_) разрешены Имя объекта может содержать число, но не может начинаться с числа Язык R чувствителен к регистру

Слайд 13





Пример
> # An example 
> x <- c(1:10)
> x[(x>8) | (x<5)]
> # yields 1 2 3 4 9 10
> # How it works 
> x <- c(1:10)
> X
>1 2 3 4 5 6 7 8 9 10
> x > 8
> F F F F F F F F T T
> x < 5
> T T T T F F F F F F
> x > 8 | x < 5
> T T T T F F F F T T
> x[c(T,T,T,T,F,F,F,F,T,T)]
> 1 2 3 4 9 10
Описание слайда:
Пример > # An example > x <- c(1:10) > x[(x>8) | (x<5)] > # yields 1 2 3 4 9 10 > # How it works > x <- c(1:10) > X >1 2 3 4 5 6 7 8 9 10 > x > 8 > F F F F F F F F T T > x < 5 > T T T T F F F F F F > x > 8 | x < 5 > T T T T F F F F T T > x[c(T,T,T,T,F,F,F,F,T,T)] > 1 2 3 4 9 10

Слайд 14





Введение в R
Для выведения списка всех объектов, доступных в текущей сессии R, используется функция lsT
> ls()
[1] "x" "y"
Для того, чтобы обратиться к коду функции, достаточно ввести ее имя в командной строке
Каждая из функций имеет аргументы, которые могут быть просмотрены при помощи клавиши tab
> ls(pattern="x")
[1] "x" "x2"
Описание слайда:
Введение в R Для выведения списка всех объектов, доступных в текущей сессии R, используется функция lsT > ls() [1] "x" "y" Для того, чтобы обратиться к коду функции, достаточно ввести ее имя в командной строке Каждая из функций имеет аргументы, которые могут быть просмотрены при помощи клавиши tab > ls(pattern="x") [1] "x" "x2"

Слайд 15





Введение в R
Если переменной присвоить некоторое значение, то ее предыдущее значение (в случае наличия такового) будет стерто без каких-либо уведомлений
Для удаления объектов из рабочей среды используется функция rm
rm(x, x2)
Удалить все объекты можно при помощи команды
rm(list=ls())
Основная функция, отвечающая за построение графиков – plot
z2 <- c(1,2,3,4,5,6)
z3 <- c(6,8,3,5,7,1)
plot(z2,z3)
title("My first scatterplot")
Описание слайда:
Введение в R Если переменной присвоить некоторое значение, то ее предыдущее значение (в случае наличия такового) будет стерто без каких-либо уведомлений Для удаления объектов из рабочей среды используется функция rm rm(x, x2) Удалить все объекты можно при помощи команды rm(list=ls()) Основная функция, отвечающая за построение графиков – plot z2 <- c(1,2,3,4,5,6) z3 <- c(6,8,3,5,7,1) plot(z2,z3) title("My first scatterplot")

Слайд 16





Введение в R
R чувствителен к регистру
MODEL, Model, model – различные объекты
Описание слайда:
Введение в R R чувствителен к регистру MODEL, Model, model – различные объекты

Слайд 17





Введение в R
> x = sin(9)/75
> y = log(x) + x^2
> x
[1] 0.005494913
> y
[1] -5.203902
> m <- matrix(c(1,2,4,1), ncol=2)
> m
> [,1] [,2]
[1,] 1 4
[2,] 2 1
> solve(m)
[,1] [,2]
[1,] -0.1428571 0.5714286
[2,] 0.2857143 -0.1428571
Описание слайда:
Введение в R > x = sin(9)/75 > y = log(x) + x^2 > x [1] 0.005494913 > y [1] -5.203902 > m <- matrix(c(1,2,4,1), ncol=2) > m > [,1] [,2] [1,] 1 4 [2,] 2 1 > solve(m) [,1] [,2] [1,] -0.1428571 0.5714286 [2,] 0.2857143 -0.1428571

Слайд 18





Рабочая среда R
Объекты, создаваемые в R, содержатся в памяти программы (рабочая среда). Объекты рабочей среды НЕ сохраняются после закрытия программы автоматически! 
Требуется ручное сохранение
Описание слайда:
Рабочая среда R Объекты, создаваемые в R, содержатся в памяти программы (рабочая среда). Объекты рабочей среды НЕ сохраняются после закрытия программы автоматически! Требуется ручное сохранение

Слайд 19





Рабочая среда R
При работе в R можно изменить имя рабочей папки. 
## just checking what the current working directory is
getwd()
## 
setwd("C:/Users/Desktop/VaR/Gmail")
Описание слайда:
Рабочая среда R При работе в R можно изменить имя рабочей папки. ## just checking what the current working directory is getwd() ## setwd("C:/Users/Desktop/VaR/Gmail")

Слайд 20





Рабочая среда R
Команды можно ввозить в интерактивном режиме в командной строке. Стрелки вверх и вниз позволяют перемещаться по истории команд
Различные проекты R необходимо хранить в различных физических папках
Описание слайда:
Рабочая среда R Команды можно ввозить в интерактивном режиме в командной строке. Стрелки вверх и вниз позволяют перемещаться по истории команд Различные проекты R необходимо хранить в различных физических папках

Слайд 21





Рабочая среда R
#Просмотр и установка параметров рабочей сессии
help(options) # 
options() # просмотреть текущие параметры
options(digits=3) # количество знаков после запятой
# Работа с предыдущими командами
history() # вывести последние 25 команд
history(max.show=Inf) #вывести все команды
Описание слайда:
Рабочая среда R #Просмотр и установка параметров рабочей сессии help(options) # options() # просмотреть текущие параметры options(digits=3) # количество знаков после запятой # Работа с предыдущими командами history() # вывести последние 25 команд history(max.show=Inf) #вывести все команды

Слайд 22





Рабочая среда R
# Сохранить историю команд
savehistory(file="myfile") # default is ".Rhistory" 
# Загрузить историю команд 
loadhistory(file="myfile") # default is ".Rhistory“
Описание слайда:
Рабочая среда R # Сохранить историю команд savehistory(file="myfile") # default is ".Rhistory" # Загрузить историю команд loadhistory(file="myfile") # default is ".Rhistory“

Слайд 23





Помощь R
В языке программирования R имеется встроенная система справки R
help.start()   # Общая справка
help(F) # Справка по функции F
?F         # То же
example(F)   # Пример использования функции F
Описание слайда:
Помощь R В языке программирования R имеется встроенная система справки R help.start()   # Общая справка help(F) # Справка по функции F ?F         # То же example(F)   # Пример использования функции F

Слайд 24





Встроенные базы R
R содержит встроенные базы данных, которые можно использовать для обучения
> data( ) # Загрузка всех доступных пакетова
> help(datasetname)
Описание слайда:
Встроенные базы R R содержит встроенные базы данных, которые можно использовать для обучения > data( ) # Загрузка всех доступных пакетова > help(datasetname)

Слайд 25





Пакеты R
Одним из преимуществ R является легкость расширения дистрибутива. Система позволяет создавать новые процедуры и функции, а также подгружать новые пакеты (‘R Package’ или ‘R library’)
Примеры доступных пакетов:
Оптимизация портфеля ценных бумаг
Анализ временных рядов
Нейронные сети
GARCH-модели
Описание слайда:
Пакеты R Одним из преимуществ R является легкость расширения дистрибутива. Система позволяет создавать новые процедуры и функции, а также подгружать новые пакеты (‘R Package’ или ‘R library’) Примеры доступных пакетов: Оптимизация портфеля ценных бумаг Анализ временных рядов Нейронные сети GARCH-модели

Слайд 26





Сохранение изображений
Для сохранения изображений R имеет особые функции. Для сохранения графика в терминале используется dev.off( )
Описание слайда:
Сохранение изображений Для сохранения изображений R имеет особые функции. Для сохранения графика в терминале используется dev.off( )

Слайд 27





Сохранение изображений
# example - output graph to jpeg file 
jpeg("c:/mygraphs/myplot.jpg")
plot(x)
dev.off()
Описание слайда:
Сохранение изображений # example - output graph to jpeg file jpeg("c:/mygraphs/myplot.jpg") plot(x) dev.off()

Слайд 28





Использование результатов модели
Язык программирования R позволяет сохранять результаты анализа и использовать их как входной параметр для дальнейшего исследования
# Пример 
lm(mpg~wt, data=mtcars) 
Пример рассчитывает параметры линейной регрессии для переменных mpg и wt. Результаты отображены на экране
Описание слайда:
Использование результатов модели Язык программирования R позволяет сохранять результаты анализа и использовать их как входной параметр для дальнейшего исследования # Пример lm(mpg~wt, data=mtcars) Пример рассчитывает параметры линейной регрессии для переменных mpg и wt. Результаты отображены на экране

Слайд 29





Использование результатов модели
# Пример 
fit <- lm(mpg~wt, data=mtcars) 
Создается объект fit, содержащий результаты построения линейной регрессии
str(fit) # просмотр свойств объекта (его структуры) 
При помощи формулы fit <- lm(mpg~wt, data=mtcars)
Был создан список (объект класса list), содержащий информацию о результатах моделирования (предсказанные значения, остатки, коэффициенты модели)
Описание слайда:
Использование результатов модели # Пример fit <- lm(mpg~wt, data=mtcars) Создается объект fit, содержащий результаты построения линейной регрессии str(fit) # просмотр свойств объекта (его структуры) При помощи формулы fit <- lm(mpg~wt, data=mtcars) Был создан список (объект класса list), содержащий информацию о результатах моделирования (предсказанные значения, остатки, коэффициенты модели)

Слайд 30





Использование результатов модели
# график остатков и прогнозных значений)
plot(fit$residuals, fit$fitted.values) 
Для просмотра выходных данных достаточно открыть по ней справку: help(lm).
Многие функции допускают применение функции plot ко всему объекту:
# produce diagnostic plots
plot(fit)
Описание слайда:
Использование результатов модели # график остатков и прогнозных значений) plot(fit$residuals, fit$fitted.values) Для просмотра выходных данных достаточно открыть по ней справку: help(lm). Многие функции допускают применение функции plot ко всему объекту: # produce diagnostic plots plot(fit)

Слайд 31





Тема 2:Входные данные
Описание слайда:
Тема 2:Входные данные

Слайд 32





Содержание
Типы данных
Импорт данных
Ввод с клавиатуры
Ввод баз данных в программную среду
Просмотр данных
Пропущенные значения
Дата и время
Описание слайда:
Содержание Типы данных Импорт данных Ввод с клавиатуры Ввод баз данных в программную среду Просмотр данных Пропущенные значения Дата и время

Слайд 33





Типы данных
Данные в R могут быть представлены в виде большого числа типов данных (скаляры, векторы, матрицы, базы данных, списки).
Описание слайда:
Типы данных Данные в R могут быть представлены в виде большого числа типов данных (скаляры, векторы, матрицы, базы данных, списки).

Слайд 34





Векторы
a <- c(1,2,5.3,6,-2,4) # числовой вектор
b <- c("one","two","three") # строковый вектор
c <- c(TRUE,TRUE,TRUE,FALSE,TRUE,FALSE)
#логический вектор
Выбор отдельных элементов вектора
a[c(2,4)] # 2-ой и 4-ый элементы вектора a
Описание слайда:
Векторы a <- c(1,2,5.3,6,-2,4) # числовой вектор b <- c("one","two","three") # строковый вектор c <- c(TRUE,TRUE,TRUE,FALSE,TRUE,FALSE) #логический вектор Выбор отдельных элементов вектора a[c(2,4)] # 2-ой и 4-ый элементы вектора a

Слайд 35





Матрицы
Все колонки матрицы должны быть одного типа и одной и той же длины
Общая форма:
mymatrix <- matrix(vector, nrow=r, ncol=c, byrow=FALSE,dimnames=list(char_vector_rownames, char_vector_colnames)) 
byrow=TRUE означает, что матрица заполняется по строкам 
byrow=FALSE означает, что матрица заполняется по столбцам
dimnames – опционально: имена строк и столбцов
Описание слайда:
Матрицы Все колонки матрицы должны быть одного типа и одной и той же длины Общая форма: mymatrix <- matrix(vector, nrow=r, ncol=c, byrow=FALSE,dimnames=list(char_vector_rownames, char_vector_colnames)) byrow=TRUE означает, что матрица заполняется по строкам byrow=FALSE означает, что матрица заполняется по столбцам dimnames – опционально: имена строк и столбцов

Слайд 36





Матрицы
# создание числовой матрицы 5 x 4
y<-matrix(1:20, nrow=5,ncol=4)
# другой пример
cells <- c(1,26,24,68)
rnames <- c("R1", "R2")
cnames <- c("C1", "C2") 
mymatrix <- matrix(cells, nrow=2, ncol=2, byrow=TRUE, dimnames=list(rnames, cnames)) 
#Определение отдельных элементов матрицы
x[,4] # 4-ая колонка матрицы
x[3,] # 3-ая колонка матрицы
x[2:4,1:3] # строки 2,3,4, столбцы 1,2,3
Описание слайда:
Матрицы # создание числовой матрицы 5 x 4 y<-matrix(1:20, nrow=5,ncol=4) # другой пример cells <- c(1,26,24,68) rnames <- c("R1", "R2") cnames <- c("C1", "C2") mymatrix <- matrix(cells, nrow=2, ncol=2, byrow=TRUE, dimnames=list(rnames, cnames)) #Определение отдельных элементов матрицы x[,4] # 4-ая колонка матрицы x[3,] # 3-ая колонка матрицы x[2:4,1:3] # строки 2,3,4, столбцы 1,2,3

Слайд 37





Массивы
Массивы имеют структуру, схожую с матрицами, но могут иметь более 2 измерений 
help(array)
Описание слайда:
Массивы Массивы имеют структуру, схожую с матрицами, но могут иметь более 2 измерений help(array)

Слайд 38





Таблицы данных
Таблица данных по структуре напоминает расширенную матрицу, однако данные в разных колонках могут быть различного типа.
d <- c(1,2,3,4)
e <- c("red", "white", "red", NA)
f <- c(TRUE,TRUE,TRUE,FALSE)
mydata <- data.frame(d,e,f)
names(mydata) <- c("ID","Color","Passed") #имена переменных
Описание слайда:
Таблицы данных Таблица данных по структуре напоминает расширенную матрицу, однако данные в разных колонках могут быть различного типа. d <- c(1,2,3,4) e <- c("red", "white", "red", NA) f <- c(TRUE,TRUE,TRUE,FALSE) mydata <- data.frame(d,e,f) names(mydata) <- c("ID","Color","Passed") #имена переменных

Слайд 39





Таблицы данных
Существует множество способов идентификации элементов таблицы данных
myframe[3:5] # колонки 3,4,5
myframe[c("ID","Age")] # колонки ID и Age
myframe$X1 # переменная x1
Описание слайда:
Таблицы данных Существует множество способов идентификации элементов таблицы данных myframe[3:5] # колонки 3,4,5 myframe[c("ID","Age")] # колонки ID и Age myframe$X1 # переменная x1

Слайд 40





Списки
Список – нумерованная последовательность объектов (компонентов списка). Список позволяет собрать множество различных объектов (не обязательно одного и того же класса)
# Пример списка из 4 компонентов 
w <- list(name="Fred", mynumbers=a, mymatrix=y, age=5.3)

# Пример списка из двух списков
v <- c(list1,list2)
Описание слайда:
Списки Список – нумерованная последовательность объектов (компонентов списка). Список позволяет собрать множество различных объектов (не обязательно одного и того же класса) # Пример списка из 4 компонентов w <- list(name="Fred", mynumbers=a, mymatrix=y, age=5.3) # Пример списка из двух списков v <- c(list1,list2)

Слайд 41





Списки
Компоненты списка определяются с использованием следующих знаков: [[]]
mylist[[2]] # 2-ой элемент списка
Описание слайда:
Списки Компоненты списка определяются с использованием следующих знаков: [[]] mylist[[2]] # 2-ой элемент списка

Слайд 42





Факторы
Переменную, принимающую конечное число значений, можно преобразовать в фактор. Объект типа «Фактор» хранит возможные значения переменной в виде вектора.
# variable gender with 20 "male" entries and 
# 30 "female" entries 
gender <- c(rep("male",20), rep("female", 30)) 
gender <- factor(gender) 
    summary(gender)
Описание слайда:
Факторы Переменную, принимающую конечное число значений, можно преобразовать в фактор. Объект типа «Фактор» хранит возможные значения переменной в виде вектора. # variable gender with 20 "male" entries and # 30 "female" entries gender <- c(rep("male",20), rep("female", 30)) gender <- factor(gender) summary(gender)

Слайд 43





Полезные функции
length(object) # Число элементов в объекте
str(object)    # Структура объекта
class(object)  # Класс объекта
names(object)  # Имена элементов объекта
c(object,object,...)  # соединить объекты в вектор
cbind(object, object, ...) # объединить объекты как столбцы
rbind(object, object, ...) # объединить объекты как строки
ls()       # Показать список текущих объектов
rm(object) # Удалить объект
Описание слайда:
Полезные функции length(object) # Число элементов в объекте str(object)    # Структура объекта class(object)  # Класс объекта names(object)  # Имена элементов объекта c(object,object,...)  # соединить объекты в вектор cbind(object, object, ...) # объединить объекты как столбцы rbind(object, object, ...) # объединить объекты как строки ls()       # Показать список текущих объектов rm(object) # Удалить объект

Слайд 44





Импорт данных (.csv)
# Первая строка должна содержать имена переменных
   mydata <- read.table("c:/mydata.csv", header=TRUE, sep=",", row.names="id")
Описание слайда:
Импорт данных (.csv) # Первая строка должна содержать имена переменных mydata <- read.table("c:/mydata.csv", header=TRUE, sep=",", row.names="id")

Слайд 45





Ввод данных с клавиатуры
Для создания данных в интерактивном режиме используются следующие функции
   age <- c(25, 30, 56)
gender <- c("male", "female", "male")
weight <- c(160, 110, 220) 
mydata <- data.frame(age,gender,weight)
Описание слайда:
Ввод данных с клавиатуры Для создания данных в интерактивном режиме используются следующие функции age <- c(25, 30, 56) gender <- c("male", "female", "male") weight <- c(160, 110, 220) mydata <- data.frame(age,gender,weight)

Слайд 46





Ввод данных с клавиатуры
# Ввод данных в режиме редактора
mydata <- data.frame(age=numeric(0), gender=character(0), weight=numeric(0))
mydata <- edit(mydata)
 
Описание слайда:
Ввод данных с клавиатуры # Ввод данных в режиме редактора mydata <- data.frame(age=numeric(0), gender=character(0), weight=numeric(0)) mydata <- edit(mydata)  

Слайд 47





Просмотр данных
Существуют различные способы просмотра имеющихся данных
# Просмотр объектов в рабочей среде
ls() 
# Просмотр переменных объекта
names(mydata)
# Просмотр структуры объекта
   str(mydata) 
# Размерность объекта
dim(object)
Описание слайда:
Просмотр данных Существуют различные способы просмотра имеющихся данных # Просмотр объектов в рабочей среде ls() # Просмотр переменных объекта names(mydata) # Просмотр структуры объекта str(mydata) # Размерность объекта dim(object)

Слайд 48





Просмотр данных
Существуют различные способы просмотра имеющихся данных
# Просмотр класса объекта
class(object)
# Вывод на экран объекта
mydata
# Вывод первые 10 строк объекта
head(mydata, n=10)
# Вывод первых 10 строк объекта
tail(mydata, n=5)
Описание слайда:
Просмотр данных Существуют различные способы просмотра имеющихся данных # Просмотр класса объекта class(object) # Вывод на экран объекта mydata # Вывод первые 10 строк объекта head(mydata, n=10) # Вывод первых 10 строк объекта tail(mydata, n=5)

Слайд 49





Пропущенные значения
В R пропущенные значения обозначаются символом NA. Невозможные значения переменных (например, в результате деления на ноль) обозначаются символом NaN (not a number). 
Тестирование переменной на пропущенные значения
is.na(x) # Возвращает TRUE, если x – пропущенное значение
y <- c(1,2,3,NA)
is.na(y) # возвращает вектор (F F F T)
Описание слайда:
Пропущенные значения В R пропущенные значения обозначаются символом NA. Невозможные значения переменных (например, в результате деления на ноль) обозначаются символом NaN (not a number). Тестирование переменной на пропущенные значения is.na(x) # Возвращает TRUE, если x – пропущенное значение y <- c(1,2,3,NA) is.na(y) # возвращает вектор (F F F T)

Слайд 50





Пропущенные значения
Замена значений переменной на пропущенные
# замена числа 99 на пропущенные значения в строке v1
mydata[mydata$v1==99,"v1"] <- NA 
Исключение пропущенных значений из анализа
Arithmetic functions on missing values yield missing values. 
x <- c(1,2,NA,3)
mean(x)          # Результат: NA
mean(x, na.rm=TRUE) # Результат: 2
Описание слайда:
Пропущенные значения Замена значений переменной на пропущенные # замена числа 99 на пропущенные значения в строке v1 mydata[mydata$v1==99,"v1"] <- NA Исключение пропущенных значений из анализа Arithmetic functions on missing values yield missing values. x <- c(1,2,NA,3) mean(x)          # Результат: NA mean(x, na.rm=TRUE) # Результат: 2

Слайд 51





Пропущенные значения
Функция complete.cases возвращает логический вектор, характеризующий заполненные наблюдения
# список строк, которые содержат пропущенные значения 
mydata[!complete.cases(mydata),]
Функция na.omit() возвращает объект с поэелементным удалением пропущенных значений
# Создание таблицы данных без пропущенных значений 
newdata <- na.omit(mydata)
Описание слайда:
Пропущенные значения Функция complete.cases возвращает логический вектор, характеризующий заполненные наблюдения # список строк, которые содержат пропущенные значения mydata[!complete.cases(mydata),] Функция na.omit() возвращает объект с поэелементным удалением пропущенных значений # Создание таблицы данных без пропущенных значений newdata <- na.omit(mydata)

Слайд 52





Дата и время
Даты представлены в R как число дней, прошедших с 1970-01-01 (в случае обратного отсчета используются отрицательные значения)
# функция as.Date( ) для преобразования формата к дате
mydates <- as.Date(c("2007-06-22", "2004-02-13"))
# число дней между 6/22/07 and 2/13/04 
days <- mydates[1] - mydates[2]
Sys.Date( ) – системное время
Date() – системная дата и время
Описание слайда:
Дата и время Даты представлены в R как число дней, прошедших с 1970-01-01 (в случае обратного отсчета используются отрицательные значения) # функция as.Date( ) для преобразования формата к дате mydates <- as.Date(c("2007-06-22", "2004-02-13")) # число дней между 6/22/07 and 2/13/04 days <- mydates[1] - mydates[2] Sys.Date( ) – системное время Date() – системная дата и время

Слайд 53





Дата и время
Следующие символы могут использоваться для форматирования даты:
Описание слайда:
Дата и время Следующие символы могут использоваться для форматирования даты:

Слайд 54





Дата и время
# print today's date
today <- Sys.Date()
format(today, format="%B %d %Y")
"June 20 2007"
Описание слайда:
Дата и время # print today's date today <- Sys.Date() format(today, format="%B %d %Y") "June 20 2007"

Слайд 55





Тема 3: Манипулирование данными
Описание слайда:
Тема 3: Манипулирование данными

Слайд 56





Содержание
Создание новой переменной
Операторы
Встроенные функции
Функции контроля / циклы
Пользовательские функции
Сортировка
Объединение
Преобразования типов
Описание слайда:
Содержание Создание новой переменной Операторы Встроенные функции Функции контроля / циклы Пользовательские функции Сортировка Объединение Преобразования типов

Слайд 57





Создание переменных
Для создания новых переменных используется оператор <-. 
#Три примера эквивалентных расчетов

mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2

attach(mydata)
mydata$sum <- x1 + x2
mydata$mean <- (x1 + x2)/2
detach(mydata)
mydata <- transform( mydata,
sum = x1 + x2,
mean = (x1 + x2)/2 
)
Описание слайда:
Создание переменных Для создания новых переменных используется оператор <-. #Три примера эквивалентных расчетов mydata$sum <- mydata$x1 + mydata$x2 mydata$mean <- (mydata$x1 + mydata$x2)/2 attach(mydata) mydata$sum <- x1 + x2 mydata$mean <- (x1 + x2)/2 detach(mydata) mydata <- transform( mydata, sum = x1 + x2, mean = (x1 + x2)/2 )

Слайд 58





Создание переменных
Создание категорий
# Создание новых категорий
mydata$agecat <- ifelse(mydata$age > 70, 
c("older"), c("younger")) 
# Создание трех возрастных категорий
attach(mydata)
mydata$agecat[age > 75] <- "Elder"
mydata$agecat[age > 45 & age <= 75] <- "Middle Aged"
mydata$agecat[age <= 45] <- "Young"
detach(mydata)
Описание слайда:
Создание переменных Создание категорий # Создание новых категорий mydata$agecat <- ifelse(mydata$age > 70, c("older"), c("younger")) # Создание трех возрастных категорий attach(mydata) mydata$agecat[age > 75] <- "Elder" mydata$agecat[age > 45 & age <= 75] <- "Middle Aged" mydata$agecat[age <= 45] <- "Young" detach(mydata)

Слайд 59





Арифметические операции
Описание слайда:
Арифметические операции

Слайд 60





Логические операторы
Описание слайда:
Логические операторы

Слайд 61





Структуры контроля/циклы
В R реализованы стандартные циклы, которые должны быть заключены в скобки {} 
С точки зрения производительности лучше использовать встроенные функции, нежели циклы, когда это возможно
Описание слайда:
Структуры контроля/циклы В R реализованы стандартные циклы, которые должны быть заключены в скобки {} С точки зрения производительности лучше использовать встроенные функции, нежели циклы, когда это возможно

Слайд 62





Контрольные структуры
if-else
if (cond) expr
if (cond) expr1 else expr2
for
for (var in seq) expr
while
while (cond) expr 
switch
switch(expr, ...) 
ifelse
ifelse(test,yes,no)
Описание слайда:
Контрольные структуры if-else if (cond) expr if (cond) expr1 else expr2 for for (var in seq) expr while while (cond) expr switch switch(expr, ...) ifelse ifelse(test,yes,no)

Слайд 63





Контрольные структуры
# Транспонирование матрицы
# Альтернативы встроенной функции t()
mytrans <- function(x) { 
  if (!is.matrix(x)) {
    warning("argument is not a matrix: returning NA")
    return(NA_real_)
  }
  y <- matrix(1, nrow=ncol(x), ncol=nrow(x)) 
  for (i in 1:nrow(x)) {
    for (j in 1:ncol(x)) {
      y[j,i] <- x[i,j] 
    }
  }
return(y)
}
Описание слайда:
Контрольные структуры # Транспонирование матрицы # Альтернативы встроенной функции t() mytrans <- function(x) {   if (!is.matrix(x)) {     warning("argument is not a matrix: returning NA")     return(NA_real_)   }   y <- matrix(1, nrow=ncol(x), ncol=nrow(x))   for (i in 1:nrow(x)) {     for (j in 1:ncol(x)) {       y[j,i] <- x[i,j]     }   } return(y) }

Слайд 64





Контрольные структуры
# Пример
z <- matrix(1:10, nrow=5, ncol=2)
tz <- mytrans(z)
Описание слайда:
Контрольные структуры # Пример z <- matrix(1:10, nrow=5, ncol=2) tz <- mytrans(z)

Слайд 65





Встроенные функции R
Практически любая операция в R связана с применением функций.
Функции могут быть применены к ЛЮБЫМ объектам (в т. ч. список определенного типа, вектор, матрица, пр.)
Описание слайда:
Встроенные функции R Практически любая операция в R связана с применением функций. Функции могут быть применены к ЛЮБЫМ объектам (в т. ч. список определенного типа, вектор, матрица, пр.)

Слайд 66





Числовые функции
Описание слайда:
Числовые функции

Слайд 67


Основы R2. Тема 1, слайд №67
Описание слайда:

Слайд 68


Основы R2. Тема 1, слайд №68
Описание слайда:

Слайд 69





Другие полезные функции
Описание слайда:
Другие полезные функции

Слайд 70





Сортировка
Сортировка данных производится при помощи функции order( ) function. По умолчанию сортировка проводится по возрастанию (ASCENDING). 
# Пример сортировки 

data(mtcars)
# sort by mpg
newdata = mtcars[order(mtcars$mpg),] 
# sort by mpg and cyl
newdata <- mtcars[order(mtcars$mpg, mtcars$cyl),]
#sort by mpg (ascending) and cyl (descending)
newdata <- mtcars[order(mtcars$mpg, -mtcars$cyl),]
Описание слайда:
Сортировка Сортировка данных производится при помощи функции order( ) function. По умолчанию сортировка проводится по возрастанию (ASCENDING). # Пример сортировки data(mtcars) # sort by mpg newdata = mtcars[order(mtcars$mpg),] # sort by mpg and cyl newdata <- mtcars[order(mtcars$mpg, mtcars$cyl),] #sort by mpg (ascending) and cyl (descending) newdata <- mtcars[order(mtcars$mpg, -mtcars$cyl),]

Слайд 71





Объединение
Для объединения двух таблиц данных используется функция merge. В большинстве случае можно объединить две таблицы данных по одному или нескольким ключам (inner join). 
# Объединение таблиц данных по ID
total <- merge(dataframeA,dataframeB,by="ID")
# Объединение таблиц данных по ID и стране
    total <- merge(dataframeA,dataframeB,by=c("ID","Country"))
Описание слайда:
Объединение Для объединения двух таблиц данных используется функция merge. В большинстве случае можно объединить две таблицы данных по одному или нескольким ключам (inner join). # Объединение таблиц данных по ID total <- merge(dataframeA,dataframeB,by="ID") # Объединение таблиц данных по ID и стране total <- merge(dataframeA,dataframeB,by=c("ID","Country"))

Слайд 72





Объединение
Добавление строк
Для добавление строк к таблице данных используется функция rbind. Таблицы данных должны иметь одинаковые переменные, но не обязательно одинаковую размерность
total <- rbind(dataframeA, dataframeB)
Описание слайда:
Объединение Добавление строк Для добавление строк к таблице данных используется функция rbind. Таблицы данных должны иметь одинаковые переменные, но не обязательно одинаковую размерность total <- rbind(dataframeA, dataframeB)

Слайд 73





Преобразования данных
Полезные функции:
is.numeric(), is.character(), is.vector(), is.matrix(), is.data.frame()
as.numeric(), as.character(), as.vector(), as.matrix(), as.data.frame)
Описание слайда:
Преобразования данных Полезные функции: is.numeric(), is.character(), is.vector(), is.matrix(), is.data.frame() as.numeric(), as.character(), as.vector(), as.matrix(), as.data.frame)



Похожие презентации
Mypresentation.ru
Загрузить презентацию