다음은 예제입니다.Spark에서 단어를 추가하는 좋은 방법이 있습니까?
데이터 집합 - dataset.txt
1 banana kiwi orange melon
코드 pairSet
의 값을 추가 부품이 효율적 궁금
scala> val table = sc.textFile("dataset.txt").map(_.split(" "))
scala> table.take(1)
res0: Array[Array[String]] = Array(Array(1, banana , kiwi , orange, melon))
scala> val pairSet = table.map{case Array(key,b,k,o,m) => (key, b+" "+k+" "+o+" "+m)}
scala> pairSet.take(1)
res1: Array[(String, String)] = Array((1, banana kiwi orange melon))
. 아니면 더 좋은 방법이 있습니까?
답장을 보내 주셔서 감사합니다. 메소드가'내 메소드보다 효율적입니다. (b + ""+ k + ""+ o + ""(0) + m)'? –
예, 귀하의 경우, 첫 번째 발생을 제외하고 나머지 문자열을 불필요하게 분할하여 나중에 다시 추가하기 때문입니다. – vdep
오오 그렇습니다! 조언 해 주셔서 대단히 감사합니다! –