데이터 프레임이 있으며, 특정 행의 행 번호/인덱스를 가져와야합니다. 나는 그것뿐만 아니라 행 번호/인덱스 예 : 문자를 포함하는 것과 같은 새로운 행을 추가하고 싶습니다. "A - 1", "B - 2"나는 이런 식으로 뭔가를 할 넣어 새를 싶습니다PySpark - UDF에서 행 인덱스 가져 오기
+------+---------+
|Letter|distances|
+------+---------+
| A| 20|
| B| 30|
| D| 80|
+------+---------+
출력
#sample data
a= sqlContext.createDataFrame([("A", 20), ("B", 30), ("D", 80)],["Letter", "distances"])
,
+------+---------------+
|Letter|distances|index|
+------+---------------+
| A| 20|A - 1|
| B| 30|B - 2|
| D| 80|D - 3|
+------+---------------+
이것은이다 기능 나는 일하고있다
def cate(letter):
return letter + " - " + #index
a.withColumn("index", cate(a["Letter"])).show()
[이] (https://stackoverflow.com/a/35948427/3433323) 도움이 될 수 있습니까? (id를 생성하고 인자'cate'에 인자로 행 id를 넘깁니다.) – mkaran