주식의 종가가있는 데이터 세트를 작성 중입니다.데이터 세트에서 선형 상관 관계를 수행하고 가장 상관이 높은 컬럼 이름을 리턴하는 방법은 무엇입니까?
'GOOG' : [
742.66, 738.40, 738.22, 741.16,
739.98, 747.28, 746.22, 741.80,
745.33, 741.29, 742.83, 750.50
],
'FB' : [
108.40, 107.92, 109.64, 112.22,
109.57, 113.82, 114.03, 112.24,
114.68, 112.92, 113.28, 115.40
],
'MSFT' : [
55.40, 54.63, 54.98, 55.88,
54.12, 59.16, 58.14, 55.97,
61.20, 57.14, 56.62, 59.25
],
'AAPL' : [
106.00, 104.66, 104.87, 105.69,
104.22, 110.16, 109.84, 108.86,
110.14, 107.66, 108.08, 109.90
]
지난 12 일 동안의 마감 가격입니다. 주어진 회사의 어느 주식 쌍이 가장 높은 상관 관계가있는 일일 종가 변동률을 결정하고이를 배열로 반환 할 것인지를 결정해야합니다.
import pandas as pd
import numpy as np
class StockPrices:
# param prices dict of string to list. A dictionary containing the tickers of the stocks, and each tickers daily prices.
# returns list of strings. A list containing the tickers of the two most correlated stocks.
@staticmethod
def most_corr(prices):
return
#For example, with the parameters below the function should return ['FB', 'MSFT'].
prices = {
'GOOG' : [
742.66, 738.40, 738.22, 741.16,
739.98, 747.28, 746.22, 741.80,
745.33, 741.29, 742.83, 750.50
],
'FB' : [
108.40, 107.92, 109.64, 112.22,
109.57, 113.82, 114.03, 112.24,
114.68, 112.92, 113.28, 115.40
],
'MSFT' : [
55.40, 54.63, 54.98, 55.88,
54.12, 59.16, 58.14, 55.97,
61.20, 57.14, 56.62, 59.25
],
'AAPL' : [
106.00, 104.66, 104.87, 105.69,
104.22, 110.16, 109.84, 108.86,
110.14, 107.66, 108.08, 109.90
]
}
print(StockPrices.most_corr(prices))
나는 NumPy와 상관 함수를 통과했지만 어떻게 최대의 상관 관계를 가지고 다음과 같은 두 벡터를 결정하는 그 정확한 기능을 사용할 수 있을까?