-1

1) 윤리 및 도덕 철학에 대한 저널 기사의 초록, 각 초록이 게시 된 날짜, 3) 각 초록이 처음 발행 된 이후 매월 다운로드 된 횟수입니다. 이 데이터를 사용하여 새로운 초록의 텍스트를 기반으로 매월 새로운 초록이 다운로드 될 횟수를 예측하는 알고리즘을 훈련 시키길 원합니다.기계 학습 알고리즘을 선택하여 종이를 다운로드 할 횟수를 예측하십시오.

나는 주로 Python으로 코드를 정기적으로 작성하지만 기계 학습을 처음 접했고이 프로젝트에 접근하는 방법을 찾는 데 어려움을 겪고 있습니다. 나의 예비 연구에서, 나는 이것이 감독 학습 방법에 의해 가장 잘 다루어지는 문제라고 믿는다. scikit-learn 패키지 (http://scikit-learn.org/stable/supervised_learning.html#supervised-learning)에 포함 된 것과 같은 여러 가지 감독 학습 방법이 있습니다. 특정 프로젝트에 가장 적합한 방법을 평가하는 방법을 모르겠습니다.

이 문제에 대한 최상의 통계 또는 기계 학습 방법은 무엇입니까? 아니면 가장 좋은 방법이 무엇인지 판단하기 위해 어떤 단계를 밟을 수 있습니까?

관련성이있는 경우 다음은 데이터베이스의 초록 예입니다.

"수천 년 동안 철학자들은 윤리의 근원에 대해 추측 해왔다. 진화론 심리학과 신경 과학에 관한 최근의 연구는이 질문에 빛을 비추고있다. 그러나이 연구도 규범 적 중요성을 가지고있다. 규범 적 윤리 이론은 어떤 상황에서는 이론이 우리의 공통적 인 도덕적 직관에 반하는 판단으로 이어진다는 것을 보여주기위한 것이다. 그러나 이러한 도덕적 직관이 우리의 진화 역사의 생물학적 잔재라면, 따라서 신경 과학에 대한 연구는 규범 적 윤리에서 직관의 역할을 재검토하도록 이끌어야한다. "

+0

내 질문에 투표하려면 최소한 투표를 한 이유에 대한 의견을 나에게 좀 더 명확하게 묻거나 문제가있는 부분을 수정하십시오. – user1454024

+0

질문이 너무 광범위합니다. SO는 매우 구체적으로 대답 할 수있는 매우 구체적인 질문에 가장 잘 작동합니다. SO는 프로그래밍에 중점을 둡니다. 기계 학습 질문의 경우 [Cross Validated] (http://stats.stackexchange.com/) – Metropolis

+0

을 사용하는 것이 좋습니다. 감사합니다. Metropolis. Cross Validated에서 재 게시했습니다. – user1454024

답변

1

실제로 감독 학습 문제이지만 선택할 수있는 방법이 많이 있습니다. 지난 달 총 다운로드 수와 단어 집합 다운로드 수를 바탕으로 다운로드를 추정 할 때 복잡한 회귀 분석을 사용한다고 생각합니다.

기계 학습 방법을 선택하는 방법에 대한 DLib 다이어그램 (물론 DLib 범위로 제한됨)을 살펴 보는 것이 좋습니다. http://dlib.net/ml_guide.svg 이것은 C++ 라이브러리이므로 편하지 않으려면 python에서 동일한 메소드를 찾아야합니다. scikit-learn.

기계 학습을 처음 사용하는 사람이라면 처음에는 개념을 연구하는 것이 더 도움이 될 것입니다. 순진한 구현으로 인해 과도한 피곤함으로 인해 어려움을 겪을 수 있습니다.

+0

질문을 Cross-Validated로 이동했습니다. 거기에 붙여 넣으려는 경우를 대비하여 답이 유용했기 때문에 알려드립니다. https://stats.stackexchange.com/questions/257509/how-to-choose -a-machine-learning-algorithm – user1454024