0
저는 문장 분석을하고 있습니다. 문장을 이해하고 키 값 쌍에 대한 정보를 해독합니다. 예를 들어의미로 단어를 정규화하십시오.
{ "product" : "milk" , "money": "200 usd" }
{ "product" : "chair" , "cost": "200 usd" }
{ "product" : "chair" , "price": "200 usd" }
지금이 JSON 넣어 위해 같은 내가 그것을 정상화하지 않는 한 사용하기 쉬운 일이 아니다. 돈을 의미하는 모든 단어를 일반화 된 단어로 정규화하고자합니다.
{ "product" : "milk" , "money": "200 usd" }
{ "product" : "chair" , "money": "200 usd" }
{ "product" : "chair" , "money": "200 usd" }
는 이제 모두
돈, 비용, 가격은 모두 실제로 돈을 의미 의미한다.
정상화하는 방법이 있나요? nltk에서 검색 한 것은 형태소 분석기와 구형 기호가 있다는 것입니다. 그러나 그것은 내 뜻대로되지 않습니다. 누군가 가이드 할 수 있습니까?
좋습니다. OP는 특정 도메인에서 작동하고 있으므로 대상에 "정식 항목"목록이 이미있을 수 있습니다. – alexis