Експортиране на данни от R: Как да експортирате данни от R в CSV, Excel

Съдържание:

Anonim

Как да експортирам данни от R

В този урок ще научим как да експортираме данни от R среда в различни формати.

За да експортирате данни на твърдия диск, имате нужда от пътя на файла и разширение. На първо място, пътят е мястото, където ще се съхраняват данните. В този урок ще видите как да съхранявате данни за:

  • Твърдият диск
  • Google Drive
  • Dropbox

На второ място, R позволява на потребителите да експортират данните в различни видове файлове. Ние покриваме разширението на основния файл:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Като цяло не е трудно да се експортират данни от R.

В този урок ще научите -

  • Експортиране на твърд диск
  • Как да експортирам DataFrame в CSV файл в R
  • Как да експортирам данни от R в Excel файл
  • Експортиране на данни от R към различен софтуер
  • Експортиране на данни от R в SAS файл
  • Как да експортирате данни от R в STATA файл
  • Взаимодействайте с облачните услуги
  • Google Drive
  • Експортиране в Dropbox

Експортиране на твърд диск

Като начало можете да запишете данните директно в работната директория. Следният код отпечатва пътя на вашата работна директория:

directory <-getwd()directory

Изход:

## [1] "/Users/15_Export_to_do" 

По подразбиране файлът ще бъде записан по пътя по-долу.

За Mac OS:

/Users/USERNAME/Downloads/ 

За Windows:

C:\Users\USERNAME\Documents\

Можете, разбира се, да зададете различен път. Например можете да промените пътя към папката за изтегляне.

Създаване на рамка за данни

Първо, нека импортираме набора от данни mtcars и вземем средното за mpg и disp, групирани по предавка.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Изход ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Таблицата съдържа три реда и три колони. Можете да създадете CSV файл с функцията write.csv в R.

Как да експортирам DataFrame в CSV файл в R

Основният синтаксис на write.csv в R за експортиране на DataFrame в CSV в R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Пример:

write.csv(df, "table_car.csv")

Обяснение на кода

  • write.csv (df, "table_car.csv"): Създайте CSV файл на твърдия диск:
    • df: име на рамката за данни в околната среда
    • "table_car.csv": Наименувайте файла table_car и го съхранявайте като csv

Забележка : Можете да използвате функцията write.csv в R като write.csv2 (), за да разделите редовете с точка и запетая за R експортиране в csv данни.

write.csv2(df, "table_car.csv")

Забележка : Само с педагогическа цел създадохме функция, наречена open_folder (), за да отвори папката с директории за вас. Трябва само да стартирате кода по-долу и да видите къде се съхранява csv файлът. Трябва да видите имена на файлове table_car.csv за експортиране на данни R в csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Как да експортирам данни от R в Excel файл

Сега ще научим как да експортираме данни от R в Excel:

Експортирането на данни от R в Excel е тривиално за потребителите на Windows и по-сложно за потребителите на Mac OS. И двамата потребители ще използват библиотеката xlsx, за да създадат файл на Excel. Малката разлика идва от инсталирането на библиотеката. Всъщност библиотеката xlsx използва Java за създаване на файла. Java трябва да бъде инсталирана, ако не присъства във вашето устройство за експортиране на Data R в Excel.

Потребители на Windows

Ако сте потребител на Windows, можете да инсталирате библиотеката директно с conda, за да експортирате dataframe в excel R:

conda install -c r r-xlsx

След като библиотеката бъде инсталирана, можете да използвате функцията write.xlsx (). В работната директория се създава нова работна книга на Excel за R експортиране в данни на Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Ако сте потребител на Mac OS, трябва да изпълните следните стъпки:

  • Стъпка 1: Инсталирайте най-новата версия на Java
  • Стъпка 2: Инсталирайте библиотека rJava
  • Стъпка 3: Инсталирайте библиотека xlsx

Стъпка 1) Можете да изтеглите Java от официалния сайт на Oracle и да я инсталирате.

Можете да се върнете към Rstudio и да проверите коя версия на Java е инсталирана.

system("java -version")

По време на урока последната версия на Java е 9.0.4.

Стъпка 2) Трябва да инсталирате rjava в R. Препоръчахме ви да инсталирате R и Rstudio с Anaconda. Anaconda управлява зависимостите между библиотеките. В този смисъл Anaconda ще се справи с тънкостите на инсталацията на rJava.

На първо място, трябва да актуализирате conda и след това да инсталирате библиотеката. Можете да копирате и поставите следващите два реда код в терминала.

conda - conda updateconda install -c r r-rjava

След това отворете rjava в Rstudio

library(rJava)

Стъпка 3) Накрая е време да инсталирате xlsx. За пореден път можете да използвате conda, за да го направите:

conda install -c r r-xlsx

Точно както потребителите на Windows, можете да запазвате данни с функцията write.xlsx ()

library(xlsx)

Изход:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Експортиране на данни от R към различен софтуер

Експортирането на данни към различен софтуер е толкова просто, колкото импортирането им. Библиотеката "убежище" осигурява удобен начин за експортиране на данни в

  • spss
  • sas
  • статистика

На първо място, импортирайте библиотеката. Ако нямате "убежище", можете да отидете тук, за да го инсталирате.

library(haven) 

SPSS файл

По-долу е даден кодът за експортиране на данните в софтуера SPSS:

write_sav(df, "table_car.sav") 

Експортиране на данни от R в SAS файл

Точно толкова просто, колкото spss, можете да експортирате в sas

write_sas(df, "table_car.sas7bdat")

Как да експортирате данни от R в STATA файл

И накрая, библиотеката на убежището позволява писането на .dta файл.

write_dta(df, "table_car.dta")

R

Ако искате да запазите рамка с данни или друг R обект, можете да използвате функцията save ().

save(df, file ='table_car.RData')

Можете да проверите файловете, създадени по-горе, в настоящата работна директория

Взаимодействайте с облачните услуги

Не на последно място, R е оборудван с фантастични библиотеки за взаимодействие с услугите за изчислителни облаци. Последната част на този урок се занимава с експортиране / импортиране на файлове от:

  • Google Drive
  • Dropbox

Забележка : Тази част от урока предполага, че имате акаунт в Google и Dropbox. Ако не, можете бързо да създадете такъв за - Google Диск: https://accounts.google.com/SignUp?hl=bg - Dropbox: https://www.dropbox.com/h

Google Drive

Трябва да инсталирате библиотеката googledrive, за да получите достъп до функцията, позволяваща взаимодействие с Google Drive.

Все още библиотеката не се предлага в Anaconda. Можете да го инсталирате с кода по-долу в конзолата.

install.packages("googledrive") 

и отваряте библиотеката.

library(googledrive)

За потребителите без конда инсталирането на библиотека е лесно, можете да използвате функцията install.packages ('ИМЕ НА ПАКЕТА) с името на пакета вътре в скобите. Не забравяйте ''. Имайте предвид, че R трябва да инсталира пакета в `libPaths () автоматично. Струва си да го видите в действие.

Качете в Google Диск

За да качите файл на Google устройство, трябва да използвате функцията drive_upload ().

Всеки път, когато рестартирате Rstudio, ще бъдете подканени да разрешите достъпа до Google Drive.

Основният синтаксис на drive_upload () е

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

След като стартирате кода, трябва да потвърдите няколко въпроса

drive_upload%<("table_car.csv", name ="table_car")

Изход:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Въвеждате 1 в конзолата, за да потвърдите достъпа

След това ще бъдете пренасочени към Google API, за да разрешите достъпа. Щракнете върху Разрешаване.

След като удостоверяването приключи, можете да излезете от браузъра си.

В конзолата на Rstudio можете да видите резюмето на извършената стъпка. Google успешно качи файла, който се намира локално на Диска. Google присвои идентификатор на всеки файл в устройството.

Можете да видите този файл в електронната таблица на Google.

drive_browse("table_car")

Изход:

Ще бъдете пренасочени към електронната таблица на Google

Импортиране от Google Диск

Качете файл от Google Диск с идентификатора е удобно. Ако знаете името на файла, можете да получите неговия идентификатор, както следва:

Забележка : В зависимост от вашата интернет връзка и размера на вашето устройство отнема време.

x <-drive_get("table_car")as_id(x)

Съхранили сте идентификатора в променливата x. Функцията drive_download () позволява изтегляне на файл от Google Drive.

Основният синтаксис е:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Най-накрая можете да изтеглите файла:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Обяснение на кода

  • drive_download (): Функция за изтегляне на файл от Google Drive
  • as_id (x): Използвайте идентификатора, за да преглеждате файла в Google Диск
  • overwrite = TRUE: Ако файлът съществува, презапишете го, в противен случай изпълнението е спряно За да видите името на файла локално, можете да използвате:

Изход:

Файлът се съхранява във вашата работна директория. Не забравяйте, че трябва да добавите разширението на файла, за да го отворите в R. Можете да създадете пълното име с функцията paste () (т.е. table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Изход:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

И накрая, можете да премахнете файла от вашето устройство Google.

## remove filedrive_find("table_car") %>%drive_rm()

Изход:

Това е бавен процес. Отнема време за изтриване

Експортиране в Dropbox

R взаимодейства с Dropbox чрез библиотеката rdrop2. Библиотеката не се предлага и в Anaconda. Можете да го инсталирате чрез конзолата

install.packages('rdrop2')
library(rdrop2)

Трябва да предоставите временен достъп до Dropbox с вашите идентификационни данни. След като идентификацията приключи, R може да създава, премахва качването и изтеглянето във вашия Dropbox.

На първо място, трябва да предоставите достъп до акаунта си. Идентификационните данни се кешират по време на цялата сесия.

drop_auth()

Ще бъдете пренасочени към Dropbox, за да потвърдите удостоверяването.

Ще получите страница за потвърждение. Можете да го затворите и да се върнете в R

Можете да създадете папка с функцията drop_create ().

  • drop_create ('my_first_drop'): Създайте папка в първия клон на Dropbox
  • drop_create ('First_branch / my_first_drop'): Създайте папка в съществуващата папка First_branch.
drop_create('my_first_drop')

Изход:

В DropBox

За да качите .csv файла във вашия Dropbox, използвайте функцията drop_upload ().

Основен синтаксис:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Изход:

В DropBox

Можете да прочетете csv файла от Dropbox с функцията drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Изход:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Когато приключите с използването на файла и искате да го изтриете. Трябва да напишете пътя на файла във функцията drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Изход:

Също така е възможно да изтриете папка

drop_delete('my_first_drop')

Изход:

Обобщение

Можем да обобщим всички функции в таблицата по-долу

Библиотека

Обективен

Функция

база

Износ csv

write.csv ()

xlsx

Експортирайте Excel

write.xlsx ()

убежище

Износ spss

write_sav ()

убежище

Износ sas

write_sas ()

убежище

Статистика за износ

write_dta ()

база

Износ R

запазване ()

googledrive

Качете Google Диск

drive_upload ()

googledrive

Отворете в Google Диск

drive_browse ()

googledrive

Извличане на идентификатор на файла

drive_get (as_id ())

googledrive

Изтегляне от Google Диск

download_google ()

googledrive

Премахнете файла от Google Диск

drive_rm ()

rdrop2

Удостоверяване

drop_auth ()

rdrop2

Създайте папка

drop_create ()

rdrop2

Качване в Dropbox

drop_upload ()

rdrop2

Прочетете csv от Dropbox

drop_read_csv

rdrop2

Изтрийте файл от Dropbox

drop_delete ()