1
나는 간단한 사전에 sklearn
에서 LabelBinarizer
의 성능을 비교하기 위해 노력하고 있어요 : 2.9169740676879883 초 ---왜 Sklearn의 LabelBinarizer가 느리지 않습니까? --- :
start_time = time.time()
result = lb.transform(sample_list*1000000)
print("--- %s seconds ---" % (time.time() - start_time))
그리고이 코드가 실행 --- :
from sklearn.preprocessing import LabelBinarizer
import time
sample_list = list('abcdefg')
lb = LabelBinarizer()
lb.fit(dep_tag_list)
lb_t = lb.transform(sample_list)
sample_dict = {key:value for (key,value) in zip(sample_list, lb_t)}
이 코드는 실행 0.6299951076507568 초 ---
start_time = time.time()
result = [sample_dict[el] for el in sample_list*1000000]
print("--- %s seconds ---" % (time.time() - start_time))
사과와 사과를 비교합니까? LableBinarizer가 왜 그렇게 느린가요?
답장을 보내 주셔서 감사합니다. 팬더의 get_dummies와 비교하는 것이 더 적절하다고 생각합니다. get_dummies는 여전히 더 빠름 – user1700890
@ user1700890 get_dummies가 내가 언급 한 모든 검사를 수행하지 않기 때문에 –
죄송합니다. 명확하지 않았습니다. get_dummies는 labelbinarizer보다 훨씬 빠릅니다. – user1700890