2014-09-08 6 views
2

나는 의미 론적으로 올바른 순열을 만들어야하는 200 단어의 목록을 가지고 있습니다. 불행히도, 그 크기의 목록을 순열하면 1 조 개의 순열 (permutations)과 같은 것이 될 것입니다.Microsoft Web Ngram API는 얼마나 많은 요청 볼륨을 처리 할 수 ​​있습니까?

내가 계획하고있는 것은 Microsoft Web Ngram 서비스와 yield 함수를 사용하여 특정 임계 값 이상의 공동 점수를 갖는 내 순열 내에서 ngram을 찾는 것입니다. 내 희망은 여기에 점수를 기반으로 필터링함으로써, 의미 론적으로 정확한 순열 만 남았습니다.

제 질문은 Microsoft Ngram API에 관한 것입니다. 200 단어로 된 목록을 통해 통과 할 많은 것들이 있습니다. 이 방법을 사용하면 - api 함수가 요청 량을 처리 할 수 ​​있다면 누군가에게 감각을 줄 수 있습니까?

감사합니다.

답변

0

만들 수있는 쿼리 수에는 제한이 없습니다. 그러나 사용 조건에 따라 스레드 액세스가 허용되지 않으며 서버 응답이 비교적 느립니다 (쿼리 당 0.12와 0.22 사이). 따라서 24 시간 동안 최대 720,000 개의 검색어를 얻을 수 있습니다. PHP의 file_get_contents (...)를 사용하고 있습니다. 더 빠른 방법이있을 수 있습니다.

필자는 필요에 따라 부분이 n-gram 데이터로 업데이트되도록 라이브러리를 다듬 었습니다. 그것은 내 코드 속도가 느리지 만 그것은 적어도 견딜 수 있습니다.

http://kkava.com/vocab/?ngram=on&imp=on&v=

+0

이것은 질문에 대한 대답을 제공하지 않습니다. 비평하거나 저자의 설명을 요청하려면 게시물 아래에 의견을 남기십시오. 자신의 게시물에 언제나 댓글을 달 수 있으며 충분한 [평판] (http://stackoverflow.com/help/whats-reputation)을 갖게되면 [모든 게시물에 댓글을 달 수] 있어야합니다 (http://stackoverflow.com/help/privileges/comment). – Ulfalizer

+0

의견에 감사드립니다. 좀 더 직접적인 대답을 편집했습니다. – Kava