2011-09-23 2 views
1

Word, Excel, Powerpoint 및 PDF와 같은 임의 비즈니스 문서의 파일 업로드를 허용하는 Rails 응용 프로그램이 있습니다. 이 모든 문서를 검색 가능하도록 만들 필요가 있습니다. Sphinx 또는 PostgreSQL 전체 텍스트 검색을 사용하는 것이 좋습니다. 가장 좋은 솔루션은 무엇입니까?Sphinx 또는 PostgreSQL 텍스트 검색과 같은 전체 텍스트 검색 색인에 Powerpoint 및 Excel 문서를 넣으려면 어떻게해야합니까?

+0

여기에 관련 질문이 있습니다. http://stackoverflow.com/questions/1207995/indexing-word-documents-and-pdfs-with-sphinx – dtt101

답변

0

의견에서 지적했듯이, 이전 질문에 의해 상당히 잘 설명됩니다.

요약하면 Sphinx 용 데이터베이스에있는 해당 파일의 관련 추출 데이터를 저장해야하며 PostgreSQL 전체 텍스트 검색도 가능할 것입니다. 스핑크스는 이제 일반 텍스트 파일을 이해할 수 있지만 (데이터베이스 열이 파일을 가리키고있는 한) PDF, DOC, XLS 등에서 데이터를 추출하는 또 다른 도구가 포함됩니다.