2017-03-16 3 views
0

나는 푸른 ML 스튜디오에서 두 분류의 찔레 점수를 비교하기 위해 노력하고있어 :비교 찔레 점수

import pandas as pd 
import numpy as np 
from sklearn.metrics import brier_score_loss 

def azureml_main(dataframe1, dataframe2): 
    colnames_1 = dataframe1.columns 
    y_true_1 = np.array(dataframe1[colnames_1[1]]) 
    y_prob_1 = np.array(dataframe1[colnames_1[-1]]) 
    brier_score_1 = brier_score_loss(y_true_1, y_prob_1) 

    colnames_2 = dataframe2.columns 
    y_true_2 = np.array(dataframe2[colnames_2[1]]) 
    y_prob_2 = np.array(dataframe2[colnames_2[-1]]) 
    brier_score_2 = brier_score_loss(y_true_2, y_prob_2) 

    data = {'brier_score': [brier_score_1, brier_score_2]} 
    result = pd.DataFrame(data, columns=['brier_score']) 

    return result 

내 문제는 스크립트 만에 첫 번째 행의 값을 출력한다는 것입니다 첫 번째 데이터 세트의 brier 점수. 두 번째 행은 비어 있습니다. 이것은 스크립트를 연결 한 방법입니다. azure

+1

'brier_score_loss' 메소드 참조를 검토하고 문제를 재현하려고했지만 두 행의 결과를 얻을 수 없어 실패했습니다. 두 번째 줄이 사라진 것은 가능하지 않은 것 같습니다. 심지어 Nan/None 값이 아닙니다. 문제 분석을 돕기 위해 샘플 데이터를 게시 할 수 있습니까? 감사. –

+0

감사합니다. Azure 개발자 지원팀에 연락했습니다. 그들은 그것을보고 있습니다. 그들이 무엇을 발견했는지 알려 드리겠습니다. – Wessi

답변

0

이 문제는 두 번째 데이터 프레임의 NaN 값으로 인해 발생했습니다. 스크립트 상단에 dataframe2 = dataframe2.dropna()을 추가하면 문제가 해결되었습니다.