Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

20. Параметры команд read.table() и write.table().




20. Параметры команд read. table() и write. table().

R может читать данные, сохраненные в текстовом (ASCII) файле. Для этого используются три функции: read. table() (которая имеет два варианта: read. csv() и read. csv2()), scan() и read. fwf(). Например, если мы имеем файл data. dat, то для того чтобы его прочитать можно набрать:

 

> mydata < -read. table (" data. dat" )

 

mydata тогда будет объектом вида data. frame, и каждая переменная будет называться, по умолчанию, V1, V2... и к ним можно обратиться индивидуально mydata$V1, mydata$V2..., или mydata[" V1" ], mydata[" V2" ]..., или mydata[, 1], mydata[, 2], …Однако, есть различия: mydata$V1 и mydata[, 1] – векторы, тогда как mydata[" V1" ] - data. frame.

 

У функции read. table() есть несколько параметров: read. table(файл, header=FALSE, sep = " ", quote = " \" ’", dec = ". ", row. names =, col. names =, as. is=FALSE, na. strings = " NA", skip=0, fill =! blank. lines. skip, check. names=TRUE, strip. white=FALSE, blank. lines. skip = TRUE)

 

Параметры:

 

файл - название файла пишется (в кавычках " " ), можно использоваться путь (символ \ не допустим, и должен быть заменен на /).

 

header - логический (ЛОЖЬ или ИСТИНА) указывает, содержит ли файл названия переменных в начале строки.

 

sep - разделитель полей используемый в файле, например sep = " \t", если это - табуляция.

 

quote - символы, используемые для обозначения переменных символьного типа.

 

dec - символ, используемый для отделения дробной части числа.

 

row. names- вектор с названиями строк, которые могут быть векторами символьного типа, или числового (или название) переменной файла (по умолчанию: 1, 2, 3... ).

 

col. names -вектор с названиями колонок (по умолчанию: V1, V2, V3... ).

 

as. is -указывает преобразовать символьных значения в факторы (если ЛОЖЬ) или сохраняет их как символы (ИСТИНА).

 

na. strings - показывает какое значение строки считать отсутствием данным (по умолчанию - NA). Пустое значение в числовой колонке тоже считается отсутствием данных.

 

Skip - число строк, которые будут пропущены перед чтением данных

 

fill = TRUE - если в файле все поля заполнены.

 

check. names- если ИСТИНА, то проверяется, допустимость имен переменных для R

 

strip. white - (условное выражение к sep ), если ИСТИНА, то удаляются дополнительные пробелы до и после символьных переменных

 

blank. lines. skip-Если имеет значение TRUE то пустые строки в файле игнорируются по умолчанию параметр имеет значение TRUE Мы можем изменить значение на FALSE, которое используется совместно с параметром fill =TRUE

 

Для сохранения данных используются функции write(), write. table(), write. matrix().

 

Функция write. table() сохраняет данные в файле формата data. frame. Формат которой:

 

write. table(x, файл, append=FALSE, quote=TRUE, sep = " ", eol = " \n", na = " NA", dec = ". ", row. names=TRUE, col. names=TRUE)

 

Параметры:

 

sep - разделитель полей используемый в файле

 

dec - символ, используемый для десятичной дроби

 

col. names-(логический) определяет, написаны ли названия столбцов в файле

 

row. names- (логический) определяет используется ли идентификатор для названий строк

 

quote- логический или числовой вектор; если TRUE то переменные символьного типа записываются с " "; если числовой вектор, его элементы дают индексы столбцов, которые записаны в " ". В обоих случаях, названия строк и столбцов также отображаются с " " если они написаны.

 

na - символ, который используется для пропущенных данных

 

eol- символ, который используется в конце каждой строки (" \n" – перевод каретки(курсора))

21. Для чего служат команды setwd() и getwd()?

Укажем путь к рабочей папке:

> setwd(" D: \\2019-2020\\02-707\\Novikova" ) или > setwd(" D: /2019-2020/02-707/Novikova" )

Читаем данные из текстового файла и выводим их на экран:

> mydata< -read. table(" N. txt", header=TRUE, sep="; ", dec=". " )

> mydata

Чтобы выяснить путь к рабочей папке R на своем компьютере используйте команду getwd() (get working directory – узнать рабочую директорию); например:

> getwd()

[1] " D: /2019-2020/02-707/Novikova"

Создать (изменить) рабочую директорию можно при помощи команды setwd() (set working directory – создать рабочую директорию):

setwd(" C: /My Documents" )

# при выполнении приведенной команды внешне ничего не произойдет, однако последующее применение команды getwd() покажет, что путь к рабочей папке изменился:

getwd()

[1] " C: /My Documents/"

22. Команды seq() и rep().

Для создания векторов, содержащих последовательную совокупность чисел, удобна функция seq() (от " sequence" – последовательность). Так, вектор с именем S, содержащий совокупность целых чисел от 1 до 7, можно создать следующим образом:

S < - seq(1, 7)

S

[1] 1 2 3 4 5 6 7

Идентичный результат будет получен при помощи команды

S < - 1: 7

S

[1] 1 2 3 4 5 6 7

В качестве дополнительного аргумента функции seq() можно задать шаг приращения

чисел:

S < - seq(from = 1, to = 5, by = 0. 5)

S

[1] 1. 0 1. 5 2. 0 2. 5 3. 0 3. 5 4. 0 4. 5 5. 0

seq(from =, to =, by)

# формирует последовательность числовых или других значений

# с заданным шагом; например, команда

а = seq(from = 1, to = 3, by = 0. 5) # или просто a = seq(1, 3, 0. 5)

# приведет к созданию числового вектора а, содержащего значения

# 1. 0, 1. 5, 2. 0, 2. 5, 3. 0

 

rep(x, times = )

# повторяет x то количество раз, которое задано аргументом times;

# например, команда

а = rep(5, 3)

# приведет к созданию вектора а, содержащего значения 5, 5, 5;

# используя аргумент each, можно повторить каждый элемент объекта x

# необходимое количество раз; так, результатом выполнения команды

rep(c(1, 2, 3), each = 2)

# будет 1 1 2 2 3 3

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...