2012-06-15 4 views
-4

나는 그룹 구매 사이트에서 데이터 추출 알고리즘을 만들어 거래를위한 애그레 게이터를 만들려고합니다. 먼저 제목, 가격, 할인, 이미지, 좌표를 추출 할 알고리즘이 필요합니다.Naive Bayes Python - PHP - javascript (node)

나는 이미지, 할인 및 좌표를위한 솔루션을 가지고 있지만 제목 및 카테고리 인식을 위해서는 순진한 베이 즈 알고리즘을 만들어야합니다. 이 작업을 수행하는 데 가장 적합한 언어는 무엇입니까? php? 파이썬? js? node.js?

알고리즘을 만들려면 무엇이 필요합니까?

예제가있는 모델은 무엇입니까? 등. 나는 100 개의 제목을주고 일부 사이트에서 모든 웹 컨텐츠를 제공하고 스크립트는 어떤 문장이 제목인지 인식 할 수 있습니까?

그래서 나는 단어가 필요 없다. 나는 문장이 필요하고 그 문장은 때로는 <h1> - <h2>과 다른 것입니다.

답변

0

진지하게 많은 게시물을 이해할 수는 없지만 순진한 베이는 여기에서 매우 일반적으로 요구되는 내용이므로 Python에서 추가 라이브러리 (예 : NLTK)없이 사용할 수있는 간단한 코드를 만들었습니다. 또한 훈련을위한 NLTK보다 더 빠름). 당신은 그것을 here 찾을 수 있습니다.

+0

내 질문 upade이야을 .. –

0

는 AI 알고리즘 어떤 경험이 없어 당신은 내가 당신이 구글 예측 API를 사용한다 제안 배울 수있는 몇 가지 알고리즘으로 추가하려면 :

https://developers.google.com/prediction/

+0

나는 내 질문을 뒤집었다. –