для проекта у меня есть большой набор данных с множеством переменных из разных анкет. Не все переменные требуются для всех анализов. Итак, я создал сценарий предварительной обработки, в котором создаются подмножества переменных (с сокращениями и без них). Однако это довольно быстро сбивает с толку. Для убедительности я решил создать index_list
который содержит все data.frames, а также data.frame с именем index_df
который содержит имя соответствующего data.frame, а также краткое описание каждой подверсии набора данных.
######################## Preparation / Loading #####################
# Clean Out Global Environment
rm(list=ls())
# Detach all unnecessary pacakges
pacman::p_unload()
# Load Required Libraries
pacman::p_load(dplyr, tidyr, gridExtra, conflicted)
# Load Data
#source("00_Preprocess.R")
#create simulation data instead
sub_data <- data.frame(x=c(2,3,5,1,6),y=c(20,30,10,302,5))
uv_newScale <- data.frame(item1=c(2,3,5,1,6),item2=c(3,5,1,3,2))
# Resolving conflicted Namepsaces
conflict_prefer("filter", "dplyr")
# Creating an Index
index_list <- list("sub_data"=sub_data,
"uv_newScale"=uv_newScale
)
index_df <- data.frame("Data.Frame"=c("sub_data",
"uv_newScale"),
"Description"=c("Contains all sumscales + sociodemographics, names abbreviated",
"Only sum scores for the UV Scale"))
Мне интересно, есть ли более эффективный способ сделать это. Как сохранить data.frames вместе с описанием в одном контейнере?