매일 (TRADEDATE) BOOK 및 COMMODITY에서 고유하게 식별되는 항목이 있습니다. 각 항목에는 매일 변경되는 현재 값 (PV)이 있습니다. 지난 달의 마지막 달력 날짜와 PV의 차이가있는 열을 얻고 싶습니다. I 루프를 이용하여 해결하지만 아무도 더 우아한 (빠른 용액)을 제안 할 수 궁금 하였다지난 달과 다른 점
library(data.table)
bwTab
COMMODITY BOOK TRADEDATE PV Desired Column
1: CASH HS_OPT_GEN 2012-09-30 66669.68 NA
2: CASH HS_OPT_GEN 2012-10-01 76333.83 9664.15
3: CASH HS_OPT_GEN 2012-10-02 76333.83 9664.15
4: CASH HS_OPT_GEN 2012-10-03 76333.83 9664.15
5: CASH HS_OPT_GEN 2012-10-04 76333.83 9664.15
---
3050: OIL HO_OIL_FIN 2012-09-30 21330.55 NA
---
3066: OIL HO_OIL_FIN 2012-10-26 42661.28 21330.73
3067: OIL HO_OIL_FIN 2012-10-27 21330.69 0.14
3068: OIL HO_OIL_FIN 2012-10-28 21330.68 0.13
3069: OIL HO_OIL_FIN 2012-10-29 21330.78 0.23
# Here is my solution
# Define a function for last day of previous month
pme <- function(date) {as.Date(paste("01",month(date),year(date),sep="."),"%d.%m.%Y")-1}
difftopme <- function(a) {
if (nrow(bwTab[COMMODITY==a[,COMMODITY] & BOOK==a[,BOOK] & TRADEDATE==pme(a[,STICHTAG]),])==0) {NA} else {
a[,PV]-bwTab[COMMODITY==a[,COMMODITY] & BOOK==a[,BOOK] & TRADEDATE==pme(a[,TRADEDATE]),PV] }
}
for (i in 1:nrow(bwTab)){a <- difftopme(bwTab[i,]) ; if (i==1){diffPVme <- a} else {diffPVme <- c(a,diffPVme)}}
#########################
dput(bwTab[1000:1010,])
structure(list(COMMODITY = c("ELEC", "ELEC", "ELEC", "ELEC",
"ELEC", "ELEC", "ELEC", "ELEC", "ELEC", "ELEC", "ELEC"), BOOK = c("HS_OUK_MKT",
"HS_OUK_MKT", "HS_OUK_MKT", "HS_OUK_MKT", "HS_OUV_EVO", "HS_OUV_EVO",
"HS_OUV_EVO", "HS_OUV_EVO", "HS_OUV_EVO", "HS_OUV_EVO", "HS_OUV_EVO"
), STICHTAG = structure(c(1353798000, 1353970800, 1354057200,
1354143600, 1348956000, 1349042400, 1349128800, 1349215200, 1349301600,
1349388000, 1349474400), class = c("POSIXct", "POSIXt"), tzone = ""),
BROKERAGE = c(123406.66, 61791.17, 62229.17, 62492.57, 0,
0, 0, 0, 0, 0, 0), DV = c(72873524.86, 38096138.75, 38283589.07,
38236199.05, 23171721.81, 23178889.59, 23187553.93, 23187426.98,
23173154.67, 23149439.13, 23149469.88), REALIZED = c(47002372.1,
23501186.05, 23501186.05, 23501186.05, 22961528, 22961528,
22961528, 22961528, 22961528, 22961528, 22961528), PV = c(25871152.76,
14594952.7, 14782403.02, 14735013, 210193.81, 217361.59,
226025.93, 225898.98, 211626.67, 187911.13, 187941.88), PV_ND = c(25973196.64,
14654807.46, 14843080.44, 14795220.35, 210222.01, 217386.44,
226048.76, 225920.76, 211641.41, 187919.95, 187949.85), BROKER_R = c(0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0), CREDIT_R = c(0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0), STRUCTURE_R = c(0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0), BROKER_UR_D = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0
), CREDIT_UR_D = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0), STRUCTURE_UR_D = c(0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0), BROKER_UN_UND = c(0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0), CREDIT_UN_UND = c(0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0), STRUCTURE_UN_UND = c(0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0)), .Names = c("COMMODITY", "BOOK", "STICHTAG",
"BROKERAGE", "DV", "REALIZED", "PV", "PV_ND", "BROKER_R", "CREDIT_R",
"STRUCTURE_R", "BROKER_UR_D", "CREDIT_UR_D", "STRUCTURE_UR_D",
"BROKER_UN_UND", "CREDIT_UN_UND", "STRUCTURE_UN_UND"), sorted = c("COMMODITY",
"BOOK", "STICHTAG"), class = c("data.table", "data.frame"), row.names = c(NA,
-11L), .internal.selfref = <pointer: 0x014024a0>)
WTF를? 'data.table' (실제로는 3k 행만 필요함)을 사용하고'for' 루프를 사용하여 행을 반복합니다. data.table의 대표적인 부분을 제공하기 위해'dput'을 사용할 수 있습니까? – Roland
또한 엉성한 코드를 정리하십시오;) 너무 게으른 사람이라면, [이 비디오보기] –
안녕하세요 Roland, 위의 dput 결과를 복사했습니다. . 나는 data.table을 사용하고 있는데, 대부분 익숙하지 않기 때문에 (구문이 매우 편리하다.) – ddg