2013-08-11 4 views
4

문자열에 사용 된 공통 접미사가 포함되어있을 때이를 감지하는 라이브러리 (Ruby gem)를 찾고 싶습니다. (예 : Inc, LLC, LLP, GmbH, PC 등)에서 비즈니스 이름을 검색하는 것이지만, 내 목표는 회사 이름과 사람 이름이있을 때를 감지하는 것입니다. 구체적으로 회사 이름을 "Company, Inc "인간 이름과 동일"마지막, 처음 "예를 들어, 우리는"Inc Company "로 상호명을 바꾸고 싶지 않습니다.문자열에 공통적 인 비즈니스 접미사 (예 : "Inc.", "LLC", "GmbH")가있는 경우를 감지하는 방법

나는 기업의 다양한 유형을 문서화하는 것으로 보입니다. 그러나 나는 ' 어떤 보석이나 간단한 목록을 찾지 못했습니다.

첫 번째 선택은 보석을 찾는 것입니다. uld는 일련의 정규식 문자열이며, 마지막으로 접미사 목록 만 남깁니다.

+1

이럴 수도 있습니다. 그러나 "full_name"필드의 내용을 기반으로 자동 검색하는 것과 달리 데이터 모델링 및 UX 문제로 기업을 처리하는 것은 일반적입니다. 가장 간단한 형식은 아마도 사용자 모델에 "company_name"필드를 선택적으로 넣는 것입니다. 또한 이름 필드에 "Last, First"와 같이 명백하게 단순한 작업을 수행하는 것이 어쨌든 사람 이름과 많이 얽혀있을 수 있습니다. 이름은 더 가까이서 볼수록 더 복잡 해지는 데이터 조각 중 하나입니다. . . 대개 가장 좋은 옵션은 문자열을 들여다 보지 않고 그대로 표시하는 것입니다. –

+0

+1 @ NeilSlater. 이름은 이름이며, 구문 분석을 통해 첫 번째/마지막 또는 비즈니스와 같은 항목인지 여부를 판단 할 수 없습니다. 차별화 할 필요가 있다면 사용자에게 첫 번째, 마지막 및 비즈니스에 대한 별도의 입력란을 제공하고 두 번째 추측을 시도하지 마십시오. 두 번째 추측은 언제나 나쁘게 결국 실패합니다. –

+0

응답 해 주셔서 감사하지만 우리는이 데이터의 작성 방법을 통제하지 못했습니다. 제어 또는 마샬링이 거의없는 여러 소스에서 제공됩니다. 이것은 부분적으로이 필드가 실제 인 또는 가상의 엔터티가 될 수있는 엔터티를 나타 내기 때문입니다. 따라서 우리는 그것을 파싱하고 존재 유형을 추론하려고 시도 할 수밖에 없습니다. –

답변

0

"consistent_company"gem에는 회사 이름에서 일반적으로 사용되는 특정 단어를 인식하는 "IsCompanyWord"기능이 있습니다.

당신은 그것을 밖으로 확인할 수 있습니다 here!

희망이 도움이됩니다.