spark를 사용하여 CSV 파일에서 내림차순을 받고 정수로 반올림하고 싶습니다. zhvi
.평균을 내림차순으로 지정 하시겠습니까?
그러나 코드 끝에서 sort(desc("Zhvi"))
을 시도해보십시오. 그것은 항상 저에게 오류를줍니다. 내 결과
from pyspark.sql.functions import col, desc
stateByZhvi = home.select('State','Zhvi').groupBy((col("State"))).avg("Zhvi").show()
및 부품 :
+-----+------------------+
|State| avg(Zhvi)|
+-----+------------------+
| AZ|246687.01298701297|
| SC|143188.94736842104|
| LA|159991.74311926606|
| MN|236449.40239043825|
| NJ| 367156.5637065637|
| DC| 586109.5238095238|
| OR| 306646.3768115942|
| VA| 282764.4986449864|
도움이 될 수 있습니다 어느 하나?
그룹화 된 평균 데이터를 정렬합니다 (desc ("Zhvi")). ? – Suresh