나는 pyspark를 사용하고 있으며 내 데이터 프레임의 첫 번째 n 행을 가져 가고 싶습니다. limit
이라는 기능이 있습니다. 그러나 매개 변수로는 int
만 필요합니다. 더 큰 값으로 호출하는 방법이 있습니까? 이 코드는 예외가 발생합니다 :limit 함수가 int를 인수로 사용하는 이유는 무엇입니까?
import sys
dataframe = spark.createDataFrame([('Alice',), ('Bob',)])
dataframe.limit(sys.maxsize)
: 나는 long
행을 추출하는 유효 요구라고 생각
An error occurred while calling o127.limit. Trace:
py4j.Py4JException: Method limit([class java.lang.Long]) does not exist
at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:318)
at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:326)
at py4j.Gateway.invoke(Gateway.java:272)
at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
at py4j.commands.CallCommand.execute(CallCommand.java:79)
at py4j.GatewayConnection.run(GatewayConnection.java:214)
at java.lang.Thread.run(Thread.java:748)
, 그것을하지?
, 왜 그런 일이 나있는 경우 해결 방법은? – desertnaut
질문은 32 비트 int (2,147,483,647) 개의 행을 더 추출하는 방법입니다. –
다행스럽게도이 게시물에 분명하고 모호하지 않게 이것을 설정합니다 ... – desertnaut