Exportando dados de R: como exportar dados de R para CSV, Excel

Índice:

Anonim

Como exportar dados de R

Neste tutorial, aprenderemos como exportar dados do ambiente R para diferentes formatos.

Para exportar dados para o disco rígido, você precisa do caminho do arquivo e de uma extensão. Em primeiro lugar, o caminho é o local onde os dados serão armazenados. Neste tutorial, você verá como armazenar dados em:

  • O disco rígido
  • Google Drive
  • Dropbox

Em segundo lugar, R permite que os usuários exportem os dados para diferentes tipos de arquivos. Cobrimos a extensão do arquivo essencial:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

No geral, não é difícil exportar dados de R.

Neste tutorial, você aprenderá-

  • Exportar para disco rígido
  • Como exportar um DataFrame para um arquivo CSV em R
  • Como exportar dados de R para arquivo Excel
  • Exportando dados de R para software diferente
  • Exportando dados de R para arquivo SAS
  • Como exportar dados de R para arquivo STATA
  • Interaja com os serviços em nuvem
  • Google Drive
  • Exportar para Dropbox

Exportar para disco rígido

Para começar, você pode salvar os dados diretamente no diretório de trabalho. O código a seguir imprime o caminho do seu diretório de trabalho:

directory <-getwd()directory

Resultado:

## [1] "/Users/15_Export_to_do" 

Por padrão, o arquivo será salvo no caminho abaixo.

Para Mac OS:

/Users/USERNAME/Downloads/ 

Para Windows:

C:\Users\USERNAME\Documents\

Você pode, é claro, definir um caminho diferente. Por exemplo, você pode alterar o caminho para a pasta de download.

Criar quadro de dados

Em primeiro lugar, vamos importar o conjunto de dados mtcars e obter a média de mpg e disp agrupados por equipamento.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Resultado ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

A tabela contém três linhas e três colunas. Você pode criar um arquivo CSV com a função write.csv em R.

Como exportar um DataFrame para um arquivo CSV em R

A sintaxe básica de write.csv em R para exportar o DataFrame para CSV em R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Exemplo:

write.csv(df, "table_car.csv")

Explicação do código

  • write.csv (df, "table_car.csv"): Crie um arquivo CSV no disco rígido:
    • df: nome do quadro de dados no ambiente
    • "table_car.csv": Nomeie o arquivo table_car e armazene-o como csv

Observação : você pode usar a função write.csv em R como write.csv2 () para separar as linhas com um ponto e vírgula para R exportar para dados csv.

write.csv2(df, "table_car.csv")

Nota : Apenas para fins pedagógicos, criamos uma função chamada open_folder () para abrir a pasta do diretório para você. Você só precisa executar o código abaixo e ver onde o arquivo csv está armazenado. Você deve ver um nome de arquivo table_car.csv para a exportação de dados R para csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Como exportar dados de R para arquivo Excel

Agora, aprenderemos como exportar dados de R para Excel:

Exportar dados de R para Excel é trivial para usuários do Windows e mais complicado para usuários do Mac OS. Ambos os usuários usarão a biblioteca xlsx para criar um arquivo Excel. A ligeira diferença vem da instalação da biblioteca. Na verdade, a biblioteca xlsx usa Java para criar o arquivo. O Java precisa ser instalado se não estiver presente em sua máquina para exportar o Data R para o Excel.

Usuários do Windows

Se você for um usuário do Windows, pode instalar a biblioteca diretamente com o conda para exportar dataframe para o excel R:

conda install -c r r-xlsx

Depois de instalar a biblioteca, você pode usar a função write.xlsx (). Uma nova pasta de trabalho do Excel é criada no diretório de trabalho para R exportar para dados do Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Se você for um usuário do Mac OS, precisará seguir estas etapas:

  • Etapa 1: instale a versão mais recente do Java
  • Etapa 2: instalar a biblioteca rJava
  • Etapa 3: instalar a biblioteca xlsx

Etapa 1) Você pode baixar o Java do site oficial da Oracle e instalá-lo.

Você pode voltar ao Rstudio e verificar qual versão do Java está instalada.

system("java -version")

No momento do tutorial, a versão mais recente do Java é 9.0.4.

Etapa 2) Você precisa instalar o rjava em R. Recomendamos que você instale R e Rstudio com Anaconda. O Anaconda gerencia as dependências entre as bibliotecas. Nesse sentido, o Anaconda irá lidar com os meandros da instalação do rJava.

Em primeiro lugar, você precisa atualizar o conda e, em seguida, instalar a biblioteca. Você pode copiar e colar as próximas duas linhas de código no terminal.

conda - conda updateconda install -c r r-rjava

Em seguida, abra o rjava no Rstudio

library(rJava)

Etapa 3) Finalmente, é hora de instalar o xlsx. Mais uma vez, você pode usar o conda para fazer isso:

conda install -c r r-xlsx

Assim como os usuários do Windows, você pode salvar dados com a função write.xlsx ()

library(xlsx)

Resultado:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Exportando dados de R para software diferente

Exportar dados para um software diferente é tão simples quanto importá-los. A biblioteca "paraíso" fornece uma maneira conveniente de exportar dados para

  • spss
  • sas
  • status

Em primeiro lugar, importe a biblioteca. Se você não tem o "haven", pode ir aqui para instalá-lo.

library(haven) 

Arquivo SPSS

Abaixo está o código para exportar os dados para o software SPSS:

write_sav(df, "table_car.sav") 

Exportando dados de R para arquivo SAS

Tão simples quanto spss, você pode exportar para sas

write_sas(df, "table_car.sas7bdat")

Como exportar dados de R para arquivo STATA

Por fim, a biblioteca haven permite a gravação de arquivos .dta.

write_dta(df, "table_car.dta")

R

Se você deseja salvar um quadro de dados ou qualquer outro objeto R, você pode usar a função save ().

save(df, file ='table_car.RData')

Você pode verificar os arquivos criados acima no diretório de trabalho atual

Interaja com os serviços em nuvem

Por último, mas não menos importante, R está equipado com bibliotecas fantásticas para interagir com os serviços de computação em nuvem. A última parte deste tutorial trata da exportação / importação de arquivos de:

  • Google Drive
  • Dropbox

Nota : Esta parte do tutorial presume que você tenha uma conta no Google e no Dropbox. Caso contrário, você pode criar rapidamente um para - Google Drive: https://accounts.google.com/SignUp?hl=en - Dropbox: https://www.dropbox.com/h

Google Drive

Você precisa instalar a biblioteca googledrive para acessar a função que permite interagir com o Google Drive.

A biblioteca ainda não está disponível no Anaconda. Você pode instalá-lo com o código abaixo no console.

install.packages("googledrive") 

e você abre a biblioteca.

library(googledrive)

Para usuários não conda, a instalação de uma biblioteca é fácil, você pode usar a função install.packages ('NOME DO PACOTE) com o nome do pacote entre parênteses. Não se esqueça do ''. Observe que, supõe-se que R deve instalar o pacote no `libPaths () automaticamente. Vale a pena ver isso em ação.

Upload para o Google Drive

Para fazer upload de um arquivo para o Google drive, você precisa usar a função drive_upload ().

Cada vez que você reiniciar o Rstudio, será solicitado que você permita o acesso ao Google Drive.

A sintaxe básica de drive_upload () é

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Depois de iniciar o código, você precisa confirmar várias perguntas

drive_upload%<("table_car.csv", name ="table_car")

Resultado:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Você digita 1 no console para confirmar o acesso

Em seguida, você é redirecionado para a API do Google para permitir o acesso. Clique em Permitir.

Assim que a autenticação for concluída, você pode sair do navegador.

No console do Rstudio, você pode ver o resumo da etapa realizada. O Google carregou com sucesso o arquivo localizado localmente no Drive. O Google atribuiu um ID a cada arquivo na unidade.

Você pode ver este arquivo na planilha do Google.

drive_browse("table_car")

Resultado:

Você será redirecionado para a planilha do Google

Importar do Google Drive

Fazer upload de um arquivo do Google Drive com o ID é conveniente. Se você souber o nome do arquivo, poderá obter seu ID da seguinte forma:

Nota : Dependendo da sua conexão com a Internet e do tamanho do seu Drive, isso pode levar algum tempo.

x <-drive_get("table_car")as_id(x)

Você armazenou o ID na variável x. A função drive_download () permite baixar um arquivo do Google Drive.

A sintaxe básica é:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Você pode finalmente baixar o arquivo:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Explicação do código

  • drive_download (): Função para baixar um arquivo do Google Drive
  • as_id (x): Use o ID para navegar pelo arquivo no Google Drive
  • overwrite = TRUE: se o arquivo existir, substitua-o; caso contrário, a execução será interrompida. Para ver o nome do arquivo localmente, você pode usar:

Resultado:

O arquivo é armazenado em seu diretório de trabalho. Lembre-se, você precisa adicionar a extensão do arquivo para abri-lo em R. Você pode criar o nome completo com a função paste () (ou seja, table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Resultado:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Finalmente, você pode remover o arquivo do seu Google Drive.

## remove filedrive_find("table_car") %>%drive_rm()

Resultado:

É um processo lento. Demora para deletar

Exportar para Dropbox

R interage com o Dropbox por meio da biblioteca rdrop2. A biblioteca também não está disponível no Anaconda. Você pode instalá-lo através do console

install.packages('rdrop2')
library(rdrop2)

Você precisa fornecer acesso temporário ao Dropbox com sua credencial. Após a identificação ser feita, R pode criar, remover upload e download para seu Dropbox.

Em primeiro lugar, você precisa dar acesso à sua conta. As credenciais são armazenadas em cache durante toda a sessão.

drop_auth()

Você será redirecionado para o Dropbox para confirmar a autenticação.

Você receberá uma página de confirmação. Você pode fechá-lo e voltar para R

Você pode criar uma pasta com a função drop_create ().

  • drop_create ('my_first_drop'): Crie uma pasta na primeira ramificação do Dropbox
  • drop_create ('First_branch / my_first_drop'): Crie uma pasta dentro da pasta First_branch existente.
drop_create('my_first_drop')

Resultado:

No DropBox

Para enviar o arquivo .csv para o seu Dropbox, use a função drop_upload ().

Sintaxe básica:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Resultado:

No DropBox

Você pode ler o arquivo csv do Dropbox com a função drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Resultado:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Quando terminar de usar o arquivo e quiser excluí-lo. Você precisa escrever o caminho do arquivo na função drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Resultado:

Também é possível deletar uma pasta

drop_delete('my_first_drop')

Resultado:

Resumo

Podemos resumir todas as funções na tabela abaixo

Biblioteca

Objetivo

Função

base

Exportar csv

write.csv ()

xlsx

Exportar excel

write.xlsx ()

refúgio

Exportar spss

write_sav ()

refúgio

Exportar sas

write_sas ()

refúgio

Exportar status

write_dta ()

base

Exportar R

Salve ()

Google Drive

Faça upload do Google Drive

drive_upload ()

Google Drive

Abra no Google Drive

drive_browse ()

Google Drive

Recuperar ID do arquivo

drive_get (as_id ())

Google Drive

Dowload do Google Drive

download_google ()

Google Drive

Remover arquivo do Google Drive

drive_rm ()

rdrop2

Autenticação

drop_auth ()

rdrop2

Crie uma pasta

drop_create ()

rdrop2

Upload para Dropbox

drop_upload ()

rdrop2

Leia csv no Dropbox

drop_read_csv

rdrop2

Excluir arquivo do Dropbox

drop_delete ()