NLP를 통해 기술, 인증, 취업 경험 등과 같은 다양한 섹션을 가진 이력서에서 해당 콘텐츠를 추출하고 해당 카테고리별로 태그를 추가하려고합니다. 다양한 문장 부호로 텍스트를 추출하는 기본 규칙을 작성할 수는 있지만 어떤 경우에는 작동하지 않을 수도 있습니다. 이 경우 Automatic segmentation 도움이 될 것입니다. 이 문제를 해결하기위한 적절한 접근 방법은 무엇입니까?문서에서 콘텐츠 추출
SKILL SET
Machine learning, Deep learning, Python, Julia, NLP
CERTIFICATIONS
Coursera: R Programming, The Data Scientist Toolbox 2015
Galvanize: Data science & big data analytics 2017
PROFESSIONAL TRAINING
MIT Professional education program in MACHINE LEARNING and text processing
PROFESSIONAL RECOGNITIONS
Microsoft Cheers Award, Microsoft Excellence award
PROFESSIONAL ROLES AND RESPONSINBILITIES
Building scalable system architecture for distributed applications
Training junior developers in advance ML
Prototyping and testing data driven products
안녕 @Bhuvanesh, 문제는 이력서에서 내용을 추출하지 못하며 범주를 다시 시작할 수 없습니다. – joel
@joe 섹션의 유형 (따라서 번호)이 고정되어 있으면 섹션 제목을 클러스터링 할 수 있습니다 (일부 벡터 표현에 기반). 분류 된 데이터를 수집하는 경우 분류자를 훈련시킬 수도 있습니다. – dada