μ •μ˜ : 데이터 처리 μ‘μš© μ†Œν”„νŠΈ 웨어가 μ²˜λ¦¬ν•˜κΈ°μ— 맀우 κ±°λŒ€(large)ν•˜κ±°λ‚˜ 볡작(complex)ν•œ λ°μ΄ν„°μ˜ μ§‘ν•©

 

βœ” ν˜„μ‘΄ν•˜λŠ” λ°μ΄ν„°μ˜ 양이 1ZBλ₯Ό 초과 ➭ μ œνƒ€(zeta)μ‹œλŒ€μ— λŒμž…

βœ” 미래의 경쟁λ ₯κ³Ό κ°€μΉ˜ 창좜의 μ›μ²œμœΌλ‘œ 빅데이터가 μ€‘μš”ν•œ 역할을 ν•˜κ²Œλ¨

 

 

λΉ…λ°μ΄ν„°μ˜ 역사

 

pc μ‹œλŒ€ - λ°μ΄ν„°λ² μ΄μŠ€ κ°œλ… 정립 , pcν†΅μ‹ μ˜ μ‹œμž‘ ➭  λ°μ΄ν„°μ˜ 규λͺ¨κ°€ μž‘κ³  ꡐλ₯˜κ°€ 적닀.

인터넷 μ‹œλŒ€ - μ΄ˆκ³ μ† μΈν„°ν…Ÿμ˜ λ„μž… (포털 μ„œλΉ„μŠ€ ) ➭ λ°μ΄ν„°μ˜ 규λͺ¨ 및 μ ˆλŒ€μ  ꡐλ₯˜λŸ‰ 증가 

λͺ¨λ°”일 μ‹œλŒ€ - λͺ¨λ°”일 인터넷 혁λͺ… (μ†Œμ…œ λ„€νŠΈμ›Œν¬) ➭ 빅데이터 κ°œλ… 정립 및 문제점 λŒ€λ‘

슀마트 μ‹œλŒ€ - 인곡지λŠ₯(ai), κΈ°κ³„ν•™μŠ΅(ml), λ”₯λŸ¬λ‹, 사물 인터넷(iot)λ“± ➭ μ§€λŠ₯을 κ°€μ§€λŠ” μ‹œλŒ€

 

 

λΉ…λ°μ΄ν„°μ˜ 3κ°€μ§€ νŠΉμ„± (3V)

 

규λͺ¨(volume) - λ””μ§€ν„Έ μ •λ³΄λŸ‰μ΄ κΈ°ν•˜κΈ‰μˆ˜μ μœΌλ‘œ 급증  ➭ μ •λ³΄λŸ‰ 증가에 λŒ€ν•œ 데이터 처리 μˆ˜μš” 증가

λ‹€μ–‘μ„±(variety) - 둜그, sns,μ†ŒλΉ„ λ“± 데이터 μ’…λ₯˜ 증가  ➭ λ‹€μ–‘ν•œ 데이터에 λŒ€ν•œ 수용 및 처리 방법둠 ν•„μš” 

속도(velocity) - IOT, 슀트리밍 λ“± μ‹€μ‹œκ°„ 정보와 속도 증가 ➭ 데이터λ₯Ό λΉ λ₯΄κ²Œ μ²˜λ¦¬ν•˜κ³  λΆ„μ„ν•˜λŠ” ν”Œλž«νΌ ν•„μš”

 

 

λΉ…λ°μ΄ν„°μ˜ μƒˆλ‘œμš΄ νŠΉμ„±

 

μ •ν™•μ„± (veracity) - κ±°λŒ€ν•œ λ°μ΄ν„°λŠ” 신뒰성이 λΆ€μ‘±ν•  수 있음. μˆ˜μ§‘ν•œ λ°μ΄ν„°μ˜ λ‹€μ–‘ν•œ ν’ˆμ§ˆμ— λŒ€μ²˜ν•˜λŠ” 방법둠

κ°€μΉ˜ (value) - νŠΈλžœλ“œ, 감정, μ§„μ‹€μ„±, μ§„μ •μ„±, 개인의 μ·¨ν–₯ λ“± λ³€ν™”ν•˜λŠ” λŒ€κ·œλͺ¨ 데이터 μ‹œλŒ€μ— κ°€μΉ˜μ˜ ν•„μš”μ„± μ¦λŒ€

κ°€λ³€μ„±(variability) - λ§₯락에 따라 μ˜λ―Έκ°€ λ³€ν™” ➭ λ°μ΄ν„°μ˜ 본래 의미λ₯Ό μ°ΎκΈ° μœ„ν•œ 방법둠 ν•„μš”

μ‹œκ°ν™”(visualization) - λ°μ΄ν„°μ˜ λΆ„μ„μœΌλ‘œλΆ€ν„° μ–»μ–΄λ‚Έ 결둠에 λŒ€ν•œ ν‘œν˜„ ➭ μ‚¬μš©μžμ˜ 이해도λ₯Ό κ³ λ €ν•œ 효과적인 방법둠 ν•„μš”

 

 

λΉ…λ°μ΄ν„°μ˜ μ’…λ₯˜

 

μ •ν˜• 데이터(Structured Data) - κ³ μ •ν˜• ν•„λ“œμ— μ €μž₯된 데이터 예)μ—‘μ…€, κ΄€κ³„ν˜• λ°μ΄ν„°λ² μ΄μŠ€(RDBMS),μŠ€ν”„λ ˆλ“œμ‹œνŠΈ λ“±

λ°˜μ •ν˜• 데이터(Semi-Structured Data) - 메타데이터, μŠ€ν‚€λ§ˆλ₯Ό μ΄μš©ν•˜μ—¬ ν‘œν˜„ν•˜λŠ” 데이터 예)XML, HTML,JSON,λ‘œκ·Έλ“± 

λΉ„μ •ν˜• 데이터(Unstructured Data) - μ •ν˜•/λ°˜μ •ν˜•μ΄ μ•„λ‹Œ λͺ¨λ“  데이터 예)ν…μŠ€νŠΈλ¬Έμ„œ, λΉ„λ””μ˜€, μ˜€λ””μ˜€ 같은 λ©€ν‹°λ―Έλ””μ–΄ μ½˜ν…μΈ ,SNS

κ°€μž₯ 큰 증가λ₯Ό λ³΄μ΄λŠ” 데이터 μœ ν˜•

 

μˆ˜μ§‘ λ‚œμ΄λ„

 

 

λΉ…λ°μ΄ν„°μ˜ μ²˜λ¦¬κ³Όμ •κ³Ό 기술

 

생성-μˆ˜μ§‘-μ €μž₯-처리-뢄석-ν‘œν˜„

 

생성

⛀ 내뢀데이터

⋆ 둜컬 ν™˜κ²½(인터넷에 μ—°κ²° λ˜μžˆμ§€ μ•Šμ€ 외뢀와 차단 λ˜μžˆλŠ” ν˜•νƒœμ˜ 데이터)에 μ €μž₯λ˜μ–΄ ꡐλ₯˜κ°€ μ—†λŠ” 데이터

⋆ λ°μ΄ν„°λ² μ΄μŠ€, νŒŒμΌκ΄€λ¦¬ μ‹œμŠ€ν…œλ“±

⛀ 외뢀데이터

⋆ λ„€νŠΈμ›Œν¬μ—μ„œ ꡐλ₯˜λ₯Ό 톡해 λ°œμƒν•˜λŠ” 데이터 

⋆ ν…μŠ€νŠΈ, λ©€ν‹°λ―Έλ””μ–΄ μ½˜ν…μΈ , 슀트림 λ“±

 

μˆ˜μ§‘

⋆ 둜그(LOG): μ‹œμŠ€ν…œ λ‚΄λΆ€ ν™œλ™ 둜그 μˆ˜μ§‘

⋆ 크둀링(Crawlng) : 인터넷 λ‘œλ΄‡μ„ μ‚¬μš©ν•œ 데이터 μˆ˜μ§‘

⋆ μ„Όμ‹±(Sensing): 각쒅 μ„Όμ„œλ₯Ό μ΄μš©ν•œ μˆ˜μ§‘ (사물 인터넷에 λΆ™μ–΄μžˆλŠ” μ„Όμ„œ)

⋆ ETL (Extraction, Transformation, Loading) : μ›μ²œ λ°μ΄ν„°μ˜ μΆ”μΆœ, λ³€ν™˜, 적재 ➭ 데이터 μ›¨μ–΄ν•˜μš°μŠ€

 

μ €μž₯

⋆ μ„œλ²„(server) :데이터에 효과적으둜 μ ‘κ·Όν•˜κΈ° μœ„ν•œ μž₯치

⋆ μŠ€ν† λ¦¬μ§€(Storage):데이터λ₯Ό μ €μž₯ν•˜λŠ” 맀체 (usb, ν•˜λ“œλ””μŠ€ν¬)

⋆ NoSQL λ°μ΄ν„°λ² μ΄μŠ€ : λΉ„μ •ν˜• 데이터 관리에 νŠΉν™”λœ λ°μ΄ν„°λ² μ΄μŠ€

 

처리

⋆ λ§΅λ¦¬λ“€μŠ€(MapReduce): λΆ„μ‚° 병렬 μ»΄ν“¨νŒ…(μ—¬λŸ¬μ»΄νŠœν„°κ°€ μ—°κ²°λ˜μžˆλŠ” ν™˜κ²½)μ—μ„œ λŒ€μš©λŸ‰ 데이터λ₯Ό μ²˜λ¦¬ν•˜κΈ° μœ„ν•œ μ†Œν”„νŠΈμ›¨μ–΄ ν”„λ ˆμž„μ›Œν¬

⋆ R, Hadoop, MATLABλ“± : 데이터 뢄석을 효과적으둜 μˆ˜ν–‰ν•˜κΈ° μœ„ν•œ λ‹€μ–‘ν•œ 처리 도ꡬ

 

뢄석

⋆ ν†΅κ³„ 뢄석(Statistical Analysis) :  κ³ μ „ 톡계, ν™•λ₯  λͺ¨λΈλ§ λ“±μœΌλ‘œ 뢄석 μˆ˜ν–‰

⋆ κΈ°κ³„ν•™μŠ΅ (Machine Learning) : 인곡지λŠ₯(AI)의 ν•œ 갈래이며 λ°˜μžλ™ λ˜λŠ” μžλ™μœΌλ‘œ λ°μ΄ν„°μ˜ νŒ¨ν„΄ 발경

⋆ NLP(Natural Language Processing) : μΈκ°„μ˜ μ–Έμ–΄ ν˜„μƒμ„ λΆ„μ„ν•˜λŠ” 인곡지λŠ₯ 

 

ν‘œν˜„

⛀ μ‹œκ°ν™”(Visualization)

⋆ λ‹€μ–‘ν•œ λ„ν‘œμ™€ κ·Έλž˜ν”½μœΌλ‘œ 이해λ₯Ό 도움

⋆ 고전적인 ν‘œν˜„ 방식에 얽맀이지 μ•Šκ³  ν˜•νƒœ, 색상, 맀체, ꡬ도 등을 λ³€ν™”ν•˜μ—¬ λ‹€μ–‘ν•œ ν‘œν˜„

 

 

λΉ…λ°μ΄ν„°μ˜ 전망

⋆ λ°μ΄ν„°μ˜ λ‹€μ–‘μ„± : μƒˆλ‘œμš΄ λ©€ν‹°λ―Έλ””μ–΄κ°€ μ¦κ°€ν• μˆ˜λ‘ λ‹€μ–‘ν•œ κ³³μ—μ„œ 정보λ₯Ό 얻을 수 μžˆλ‹€.

⋆ λ°μ΄ν„°μ˜ μ–‘ : μ ‘κ·Ό ν•˜λŠ” 맀체가 λŠ˜μ–΄λ‚ μˆ˜λ‘ λ°μ΄ν„°μ˜ 양은 λŠ˜μ–΄λ‚œλ‹€.

⋆ 슀마트 기기의 λ³΄κΈ‰μœ¨ : 이미 슀마트 κΈ°κΈ°λ₯Ό κ°–κ³  μžˆλŠ” μ‚¬λžŒλ“€μ΄ μ¦κ°€ν•˜λ©΄μ„œ κΈ°κΈ° λ³΄κΈ‰μœ¨μ˜ μ¦κ°€μœ¨μ€ μ¦κ°€λŸ‰μ΄ 쀄어듀 것이닀.

⋆ 응닡 속도 μš”κ΅¬μΉ˜ : μ‹œκ°„μ΄ μ§€λ‚  수둝 μ–‘κ³Ό 닀양성이 λŠ˜μ–΄λ‚˜μ„œ 응닡 속도 μš”κ΅¬λŠ” 빨라질 것이닀.

 

 

λΉ…λ°μ΄ν„°μ˜ ν™œμš© λΆ„μ•Ό

 

⋆ 곡곡 μ„œλΉ„μŠ€ : λ°©λŒ€ν•œ 데이터λ₯Ό κ΅­κ°€μ μœΌλ‘œ ν™œμš© κ°€λŠ₯ 각쒅 μžμ› 관리 슀마트 κ·Έλ¦¬λ“œ, μž¬λ‚œ λ°©μž¬λ“±

⋆ κ³Όν•™ 연ꡬ : λ°μ΄ν„°λ‘œλΆ€ν„° μƒˆλ‘œμš΄ 의미 발견 κ°€λŠ₯ ➭ 데이터λ₯Ό ν‘œν˜„ν•˜λŠ” μƒˆλ‘œμš΄ 방법둠 적용

⋆ 의료 μ„œλΉ„μŠ€ : 의료 λ°μ΄ν„°μ˜ 효율적, 효과적 μˆ˜μ§‘ 및 곡유  진단, 처방, μ‹œμˆ , 수술 등에 의료 혁λͺ… μ˜ˆμƒ

⋆ λ¬Όλ₯˜/μœ ν†΅ : 데이터λ₯Ό 톡해 μ†ŒλΉ„μžμ˜ λ‹ˆμ¦ˆ (needs)λ₯Ό νŒŒμ•…ν•΄ 보닀 효과적인 λ¬Όλ₯˜ μœ ν†΅μ΄ κ°€λŠ₯

⋆ 제쑰 μ‚°μ—… : μ œν’ˆμ˜ μˆ˜μœ¨μ„ κ·ΉλŒ€ν™”ν•˜κΈ° μœ„ν•˜μ—¬ 데이터λ₯Ό ν™œμš© ➭ λΆˆλŸ‰λ₯ μ„ μ΅œμ†Œν™” ν•  수 있고 제쑰의 νš¨μœ¨ν™” κ°€λŠ₯

⋆ 정보 톡신 : λͺ¨λ°”일 κΈ°κΈ°(슀마트폰)의 보급 ν™•λŒ€λ‘œ 개인 데이터 양이 증가 ➭ κ°œμΈν™”λœ μ„œλΉ„μŠ€ 및 λͺ©ν‘œ λ§ˆμΌ€νŒ… κ°€λŠ₯

 

 

λΉ…λ°μ΄ν„°μ˜ ν™œμš© 사둀

 

⋆ μ •μΉ˜ : 유ꢌ자 DBμ—μ„œ 유ꢌ자λ₯Ό λΆ„λ₯˜ν•˜κ³  μ„±ν–₯ νŒŒμ•… ➭ μ†Œμ…œ λ―Έλ””μ–΄λ₯Ό ν†΅ν•˜μ—¬ 유ꢌ자 정보 μˆ˜μ§‘

⋆ 경제 : 고개그이 κ΅¬λ§€λ‚˜ ν™œλ™ 기둝을 λΆ„μ„ν•˜μ—¬ μ·¨ν–₯ 뢄석 ( κ°œμΈν™”λœ μΆ”μ²œ μ‹œμŠ€ν…œ)

⋆ λ¬Έν™” : μ •ν˜• 및 λΉ„μ •ν˜• 데이터λ₯Ό μˆ˜μ§‘ 및 뢄석 ➭ 효율적인 νŒ€μ˜ μš΄μ˜μ„ κ°€λŠ₯μΌ€ 함

⋆ κ³Όν•™ : ν†΅κ³„ν•™μ˜ 비약적인 λ°œμ „μœΌλ‘œ μœ μ „μžμ˜ 뢄석 및 λ°œν˜„κ³Ό μ‘°μ ˆμ— 획기적인 λ³€ν™”

 

 

λΉ…λ°μ΄ν„°μ˜ 미래 전망

 

⋆ 데이터 혁λͺ… : μ •μΉ˜, 경제, μ‚¬νšŒ, λ¬Έν™”, IT λ“± 데이터가 λ°œμƒν•˜λŠ” μ „ 뢄야에 λ„μž… ➭ μ‚¬νšŒ μ „λ°˜μ˜ 데이터 혁λͺ…

⋆ μƒˆλ‘œμš΄ κ°€μΉ˜μ™€ λΆ„μ•Ό 창좜  : κΈ°μ‘΄ 데이터 뿐만 μ•„λ‹ˆλΌ 미래의 λ°μ΄ν„°λ‘œλΆ€ν„° μƒˆλ‘œμš΄ 의미λ₯Ό μ°Ύμ•„λ‚΄κ³  κ°€μΉ˜μ™€ λΆ„μ•Ό 창좜 κΈ°λŒ€

 

 

 

 

 

 

+ Recent posts