๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
ํ•˜๋‘ก(Hadoop)

๊ฐ„๋‹จํ•˜๊ฒŒ ํ•˜๋‘ก ์‚ฌ์šฉํ•ด๋ณด๊ธฐ(wordcount)

by ํฌ๋ฆฌ๋„ฅ์Šค์„๋ผ์ด์Šค 2022. 12. 23.

ํ•˜๋‘ก์„ ์„ค์น˜ํ–ˆ์œผ๋‹ˆ ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ์˜ˆ์ œ์ธ wordcount๋ฅผ ํ•œ ๋ฒˆ ํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ฑ…์˜ ์˜ˆ์ œ๋Š” hadoop-env.sh ํŒŒ์ผ ์† ์˜๋‹จ์–ด๋ฅผ ์„ธ๋Š” ๊ฒƒ์ธ๋ฐ, ์ €๋Š” ๊ฐ„๋‹จํ•˜๊ฒŒ ๋‰ด์Šค ๊ธฐ์‚ฌ๋ฅผ ์‚ฌ์šฉํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

 

http://news.tf.co.kr/read/entertain/1987544.htm

 

'์œ ํ€ด์ฆˆ' ๊น€๋ฏผ์žฌ·ํ™ฉ์ธ๋ฒ”, ์›”๋“œ์ปต 16๊ฐ• ์ง„์ถœ ๋น„ํ•˜์ธ๋“œ ๊ณต๊ฐœ 

๊น€๋ฏผ์žฌ "์†ํฅ๋ฏผ ํ˜ธํ†ต ์žฅ๋ฉด์— ์‹ธ๊ฐ€์ง€ ์—†๋‹จ ์†Œ๋ฆฌ ๋“ค์–ด" ๊ณ ๋ฐฑ   ๊ตญ๊ฐ€๋Œ€ํ‘œ ์ถ•๊ตฌ์„ ์ˆ˜ ๊น€๋ฏผ์žฌ์™€ ํ™ฉ์ธ๋ฒ”์ด 21์ผ ๋ฐฉ์†ก๋œ tvN ์œ  ํ€ด์ฆˆ ์˜จ ๋” ๋ธ”๋ก์—์„œ 2022 ์นดํƒ€๋ฅด ์›”๋“œ์ปต ๋น„ํ™”๋ฅผ ๊ณต๊ฐœํ–ˆ๋‹ค..

news.tf.co.kr

 

ํ•ด๋‹น ๊ธฐ์‚ฌ์˜ ๋‚ด์šฉ์„ ํ…์ŠคํŠธ ํŒŒ์ผ๋กœ ๋ฐ”ํƒ•ํ™”๋ฉด์— ์ €์žฅํ–ˆ์Šต๋‹ˆ๋‹ค.

 

์ดํ›„ /opt/homebrew/Cellar/hadoop/3.3.4/libexec/bin ๊ฒฝ๋กœ๋กœ ์ด๋™ํ•ด ํ•˜๋‘ก ๋ช…๋ น์–ด๋“ค์„ ์‹คํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค.

bin ํด๋”

 

๋จผ์ € HDFS์— ํŒŒ์ผ์„ ์˜ฌ๋ฆฌ๊ธฐ ์ „์— ํŒŒ์ผ์ด ์—…๋กœ๋“œ๋  ํด๋”๋ฅผ ํ™•์ธํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

(์ฒ˜์Œ์— ๋ฐ”๋กœ test ํด๋”๋ฅผ ๋งŒ๋“ค์–ด ๋ฒ„๋ ค์„œ ์ €๋Š” user ์™ธ์—๋„ test ํด๋”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค)

hadoop fs -ls /

 

user ํด๋”์—๋Š” inamsu๋ผ๋Š” ํด๋”๊ฐ€ ์žˆ๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๊ณ , ์ €๋Š” inamsu ํด๋” ์•ˆ์—๋Š” ๋”ฐ๋กœ ํด๋”๊ฐ€ ์žˆ์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค.

hadoop fs -ls /user

 

์ €๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ช…๋ น์–ด๋ฅผ ์ด์šฉํ•ด inamsu ํด๋”์— test๋ผ๋Š” ํด๋”๋ฅผ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.
(์ด๋•Œ ์ „์ฒด ๊ฒฝ๋กœ๋ฅผ ๋‹ค ์ ์–ด์คฌ๊ณ , hadoop fs -ls /user/inamsu ๋ฅผ ์ด์šฉํ•ด test ํด๋”๊ฐ€ ์ƒ๊ธด ๊ฒƒ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.)

hadoop fs -mkdir -p /user/inamsu/test

 

์„ค์น˜๋œ ํ•˜๋‘ก์—๋Š” wordcount ์˜ˆ์ œ ํŒŒ์ผ์ด ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ํ•ด๋‹น ํŒŒ์ผ์„ ์ด์šฉํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ด ์˜ˆ์ œ ํŒŒ์ผ(jar)์„ ์ €๋Š” /opt/homebrew/Cellar/hadoop/3.3.4/libexec/share/hadoop/mapreduce ์—์„œ ์ฐพ์„ ์ˆ˜ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค.

์˜ˆ์ œ ํŒŒ์ผ

 ๋‹ค์‹œ bin ํด๋”์—์„œ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ช…๋ น์„ ์‹คํ–‰์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

hadoop jar /opt/homebrew/Cellar/hadoop/3.3.4/libexec/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount /user/inamsu/test/news.txt /user/inamsu/test/result

hadoop-mapreduce-examples-3.3.4.jar ํŒŒ์ผ์— ์žˆ๋Š” wordcount ํด๋ž˜์Šค๋ฅผ ์‹คํ–‰ํ•˜๊ณ , ์ž…๋ ฅ๊ฐ’์œผ๋กœ๋Š” /user/inamsu/test/์— ์žˆ๋Š” news.txt ํŒŒ์ผ์„, ์ถœ๋ ฅ๊ฐ’์œผ๋กœ /user/inamsu/test/result ํด๋”๋ฅผ ์ง€์ •ํ–ˆ์Šต๋‹ˆ๋‹ค.(์ด๋•Œ result ํด๋”๋Š” ์ƒ์„ฑ๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค)

 

๋ชจ๋“  ๊ณผ์ •์ด ๋๋‚˜๊ณ  ๋ณด๋ฉด /user/inamsu/test์— result ํด๋”๊ฐ€ ์ƒ๊ธด ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

result ํด๋”์—๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ฒฐ๊ณผ ํŒŒ์ผ์ด ๋“ค์–ด์žˆ์Šต๋‹ˆ๋‹ค.

 

๋‹ค์Œ ๋ช…๋ น์–ด๋ฅผ ์ด์šฉํ•ด ํ•œ ๋ฒˆ ๊ฒฐ๊ณผ๋ฅผ ํ™•์ธํ•ด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

hadoop fs -cat /user/inamsu/test/result/part-r-00000

 

๋‚˜๋ฆ„ ๋ด์ค„๋งŒ ํ•œ ๊ฒฐ๊ณผ์ธ ๊ฒƒ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.