내가 매끄러운 10K에 대한 변환 비율을주는 문장의 집합 같은구문 분석 문장 추출 변환
- 만 뭔가 ∫1
- ∫1에 대한이 값
- 1200 뭔가 ∫0.1 에 대한
- 3 스톰에 대한 3000 Smth 판매
위의 문장은 모두 가상의 무언가 (SMTH)와 가상의 무언가 (SMTH)의 비율을 보여줍니다. ∫의 정수 (정수). 이 두 단위 사이의 전환율을 추출 할 방법이 필요합니다. 어려움은 숫자가 다른 방식으로 (10,000 또는 10000 또는 10k) 포맷 될 수 있고, 단위가 다르게 쓰일 수 있으며 (SMTH 및 다른 대문자 사용), 단위 순서가 다릅니다 ("x SMTH for ∫x"또는 "∫x for x SMTH "), 때로는 단위가 ∫x 또는 x∫로 기록됩니다.
TL : DR : 어떻게 든 위의 문자열을 수학적 관계로 형식화하지만 여러 형식에주의를 기울여야합니다.
나는 이것이 많이 묻고 꽤 복잡하다는 것을 알고있다. 이미 비슷한 질문이있는 경우 기꺼이 살펴볼 것입니다.
당신이 물어 보는 언어는 무엇입니까?
var val = get sentence,
integral,
something;
val = val.replace(",", "").replace("k ", "000 ").replace("m ", "000000 ").replace("million ", "000000 ").replace(" million ", "000000 ").replace(" something", "SMTH").replace(" smth", "SMTH");
words = val.split(" ");
for (var i = 0; i < words.length; i++) {
if (words[i].indexOf("$")!==-1) {
integral = words[i].replace("∫" , "");
} else if (words[i].indexOf("SMTH")!==-1) {
something = words[i].replace("SMTH" , "");
}
}
단순화 된 자바 스크립트/의사 코드
단어 구조가있는 문장이 정말 다양합니다. 돈을 위해 뭔가. 뭔가를위한 돈. 이것을 번역하는데 많은 어려움이있는 것 같습니다. – sln
나는 하나의 통화에 대한 모든 언급을 하나의 키워드로 바꾸어 통화 묵상을 통일하고 다른 숫자를 "실제"숫자로 포맷하려고 시도했다. 그게 좀 깨끗해 지긴하지만, "for"나 "selling"같은 필러 단어를 모두 다 써 버리면됩니다. ( – aNewStart847