์คํํฌ ๋ฐ์ดํฐ ํ๋ ์(์์ฑ, ์คํค๋ง)
์๋
ํ์ธ์ ํฌ๋ฆฌ๋ฅ์ค์๋ผ์ค์
๋๋ค. ์ค๋์ ์คํํฌ์ ๋ฐ์ดํฐ ํ๋ ์์ ์์ฑํ๋ ๋ฒ๊ณผ ์คํค๋ง์ ๋ํด์ ์ ๋ฆฌํด๋ณด๋ ค๊ณ ํฉ๋๋ค. ๋ฐ์ดํฐ ํ๋ ์ ์์ฑ ๋จผ์ ๋ฐ์ดํฐ ํ๋ ์์ ์์ฑํ๋ ๋ฐฉ๋ฒ์
๋๋ค. ๊ฐ๋จํ๊ฒ ํ์ฌ EPL ๋์ ์์ ์์ 5๋ช
์ ๋ํ ์ ๋ณด๋ก ๋ง๋ค์ด ๋ณด๊ฒ ์ต๋๋ค. ๋จผ์ ์ค์นผ๋ผ์์ ๋ฐ์ดํฐ ํ๋ ์์ ๋ง๋ค ๋๋ Sequence ํด๋์ค๋ฅผ ์ฌ์ฉํด ๋ค์๊ณผ ๊ฐ์ด ์์ฑํ๋ฉด ๋ฉ๋๋ค. ์์ฑํ๋ฉด ์ปฌ๋ผ ์ด๋ฆ์ด ์๊ธฐ ๋๋ฌธ์ ๋ค์ toDF() ๋ช
๋ น์ด๋ก ์ปฌ๋ผ๋ช
์ ์ง์ ํด์ฃผ์๋ฉด ์ปฌ๋ผ๋ช
์ด ์ถ๊ฐ๋ฉ๋๋ค. # ๋ฐ์ดํฐ ํ๋ ์ ์์ฑ(์ปฌ๋ผ๋ช
X) val self_df = spark.createDataFrame(Seq(("์๋ง ํ๋๋", 21), ("ํด๋ฆฌ ์ผ์ธ", 15), ("์ด๋ฐ ํ ๋", 12), ("๋ฏธํธ๋ก๋น์น", 11), ("๋ชจ๋ ๋
ธ", 10))) # ๋ฐ..
2023. 1. 14.