Spark: The Definitive Guide ๋ด์ฉ ์ ๋ฆฌ Schema DataFrame์ column name๊ณผ data type์ ์ ์ Data source์์ schema๋ฅผ ์ป๊ฑฐ๋ ์ง์ ์ ์ ๊ฐ๋ฅ ์ฌ๋ฌ ๊ฐ์ type filed๋ก ๊ตฌ์ฑ๋ object Spark๋ runtime์ data type์ด schema์ data type๊ณผ ์ผ์นํ์ง ์์ผ๋ฉดโฆ
Spark: The Definitive Guide ๋ด์ฉ ์ ๋ฆฌ Overview Apache Spark Community๋ 2.0 version์ ์ถ์ํ๋ฉด์ structured API๋ฅผ ๋์ ํ๋ค. 1.x ๋ฒ์ ์์๋ RDD์ ๊ฐ์ lower-level API๋ฅผ ํ์ฉํ๋ ๋ฐฉ๋ฒ์ด ์ฃผ๋ฅผ ์ด๋ฃจ์์ผ๋, 2.0 ์ถ์ ์ดํ์๋ ์๋ํ๋ ์ต์ ํ ๊ธฐ๋ฅ๊ณผ ์ฅ์ ๋์ ๋ฅ๋ ฅ์ ์ ๊ณตโฆ
Spark: The Definitive Guide ๋ด์ฉ ์ ๋ฆฌ Production Application Spark๋ฅผ ์ฌ์ฉํ๋ฉด big data program์ ์ฝ๊ฒ ๊ฐ๋ฐ ํ ์ ์๋ค. spark-submit ๋ํํ shell์์ ๊ฐ๋ฐํ program์ production application์ผ๋ก ์ฝ๊ฒ ์ ํ ๊ฐ๋ฅ application code๋ฅผ cluster์โฆ
Spark: The Definitive Guide ๋ด์ฉ ์ ๋ฆฌ Cluster ์ฌ๋ฌ ์ปดํจํฐ์ ์์์ ๋ชจ์ ํ๋์ ์ปดํจํฐ์ฒ๋ผ ์ฌ์ฉํ ์ ์๊ฒ ๋ง๋ ๋ค. Cluster์์ ์์ ์ ์กฐ์จํ ์ ์๋ framework๊ฐ ํ์ํ๋ฐ, spark๊ฐ ๊ทธ๋ฐ ์ญํ ์ ํ๋ framework Spark Application Spark๋ ์ฌ์ฉ ๊ฐ๋ฅํ ์์์ ํ์ ํ๊ธฐ ์ํด clusterโฆ
Spark: The Definitive Guide ๋ด์ฉ ์ ๋ฆฌ Apache Spark ๋น ๋ฐ์ดํฐ๋ฅผ ์ํ ํตํฉ(unified) ์ปดํจํ ์์ง๊ณผ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์งํฉ ํด๋ฌ์คํฐ ํ๊ฒฝ์์ ๋ฐ์ดํฐ๋ฅผ ๋ณ๋ ฌ๋ก ์ฒ๋ฆฌํ๋ ์คํ์์ค ์์ง Python, Java, Scala, R ์ ์ง์ Features ๋ค์ํ ๋ฐ์ดํฐ ๋ถ์ ์์ ์ ์ผ๊ด์ฑ ์๋ API๋ก ์ํํ ์ ์๋๋ก ์ค๊ณ (consโฆ
Transaction Runtime์์, ๋ ์ ์ ์์ ์ธํฐ๋์ ์ ๋ํ ์๋ต์ผ๋ก fragments๋ฅผ ์ถ๊ฐ, ์ ๊ฑฐ, ๊ต์ฒด, ๋๋ ๋ค๋ฅธ ๋์๋ค์ ์ํํ ์ ์๋ค. ์ด๋ฌํ fragment ๋ณ๊ฒฝ๋ค์ ์ด๋ผ๊ณ ํ๋ฉฐ, class์์ ์ ๊ณตํ๋ API๋ฅผ ์ฌ์ฉํ์ฌ transaction ๋ด์์ ์ํํ ์์ ์ ์ง์ ํ ์ ์๋ค. ํ๋์ transaction์ ์ฌ๋ฌ ๊ฐ์ actiโฆ
Wildcard: ? ๋ฌผ์ํ(?)๋ generic programming์์ wildcard๋ก ์ฌ์ฉ๋๋ค. Unknown type์ ๋ํ๋ธ๋ค. Parameter, field, ์ง์ญ ๋ณ์, return์ type ๋ฑ๊ณผ ๊ฐ์ด ๋ค์ํ ์ํฉ์์ ์ฌ์ฉํ ์ ์๋ค. Types of wildcards Upper Bounded Wildcards Collectiontype<โฆ
Generics Parameterized types Integer, String ๋ฑ์ ํ์ ์ methods, classes, interfaces์ parameter๋ก ์ฌ์ฉํ๊ธฐ ์ํจ์ด๋ค. Generics๋ฅผ ์ฌ์ฉํ๋ฉด, ๊ฐ๊ฐ ๋ค๋ฅธ data types์ ๋์ํ๋ class๋ค์ ์์ฑํ ์ ์๋ค. Advantages Code Reuse: method, class, โฆ
JNI JVM์์ ๋์๊ฐ๋ bytecode์ native code ์ฌ์ด์ bridge Application์ด ์์ ํ java๋ก ์ฐ์ฌ์ง ์ ์์ง๋ง, java ํ๋๋ก๋ application ์๊ตฌ์ฌํญ์ ์ถฉ์กฑ์ํค์ง ๋ชปํ๋ ๊ฒฝ์ฐ๊ฐ ์๋ค. ์ด๋ ๊ฒ application์ด java๋ง์ผ๋ก ์์ฑ๋์ง ๋ชปํ๋ ๊ฒฝ์ฐ, JNI์ ์ฌ์ฉํ์ฌ Java native methods๋ฅผ ์์ฑโฆ
Inner Class (๋ด๋ถ ํด๋์ค) ํด๋์ค ์์ ์๋ ํด๋์ค Inner class์์๋ Outer class์ ๋ชจ๋ method์ variables๋ฅผ ์ฌ์ฉํ ์ ์๋ค. Private์ผ๋ก ์ง์ ๋ ๊ฒ๋ ์ ๊ทผ๊ฐ๋ฅํ๋ค. ์๋ก ๋ค๋ฅธ ๋ด๋ถ ํด๋์ค์์ ๋๊ฐ์ interfaces๋ฅผ ๊ตฌํํ ์ ์๊ธฐ ๋๋ฌธ์, overriding methods๊ฐ ํ์ํ ๊ฒฝ์ฐ ์ ์ฉํ๋ค. Eโฆ