You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Boa Noite, eu tenho alguns notebooks que ler 685 arquivos csv de 1GB e transforma em Parquet, esse processo e lento, gostaria de fazer em Julia para ver se fica mais rapido, mas nao encotrei aqui um exemplo para isso. Ja tem uma bliblioteca que faz isso ?
Obrigado !!
The text was updated successfully, but these errors were encountered:
Eu não sei se entendi bem o que você precisa fazer ou seja já tentou alguma coisa em Julia, mas eu imagino que seja necessário algo como o seguinte (julia v1.4.2). Nunca trabalhei com arquivos parquet, mas encontrei o pacote [Diban] que parece ser capaz de transformar um DataFrame num arquivo parquet (porém de forma lenta, segundo o autor do pacote). Para ler arquivos parquet, o pacote Parquet parece ser apropriado (mas ele só é capaz de ler, e não escrever, pelo que entendi).
using CSV
using Diban
using DataFrames
# colocar dentro de uma função, pois o escobo global é sempre lentofunctionprocessar_dados(n)
dfinal =DataFrame(...)
for i =1:n
df =DataFrame!(CSV.File("arquivo$(i).csv"))
# processar e fundir os dados de df em dfinalendwrite_parquet("arq.parquet", dfinal)
end# recomendo rodar a função lendo somente um arquivo para# forçar o julia a pré-compilar tudo antes de fazer o trabalho pesadoprocessar_dados(1)
processar_dados(N) # rodar a função pra valer agora
Boa Noite, eu tenho alguns notebooks que ler 685 arquivos csv de 1GB e transforma em Parquet, esse processo e lento, gostaria de fazer em Julia para ver se fica mais rapido, mas nao encotrei aqui um exemplo para isso. Ja tem uma bliblioteca que faz isso ?
Obrigado !!
The text was updated successfully, but these errors were encountered: