나는 스파크가 생겼고 빠른 푸리에 변환과 svms 등의 분류/회귀와 같은 작업을 수행해야하는 스트리밍 응용 프로그램을 작성해야합니다. 파이썬의 거대한 다양성 때문에 pyspark에서이 작업을 수행하고 싶습니다. numpy, scikit-learn 같은 모듈. 내 질문은, 스트리밍 응용 프로그램에서 그런 것들을 할 수 있습니까? 내가 아는 한, spark는 dstream을 사용합니다. 이 스트림은 numpy 배열 또는 파이썬 함수의 입력으로 사용할 수있는 비슷한 것과 비슷합니까?pyspark 스트리밍은 기계 학습/과학 컴퓨팅에 적합합니까?
Pyspark 파이썬 언어로 코딩되는 스파크에 프로그램/코드/알고리즘을 실행하는 데 사용되는
괜찮 았지만 한 번에 두 가지 방법 (스트리밍과 기계 학습)을 모두 수행 할 수 있습니까? – maxE