λΉ λ°μ΄ν°μ μμ§
λΉ λ°μ΄ν°μ μμ±
λ°μ΄ν°(Data) : κ΄μ°° λ° μΈ‘μ μ ν΅ν νλ / λ¨μν μ¬μ€μ΄λ κ²°κ³Ό / κ°κ³΅λμ§ μμ μν
μ 보(Information) : λ°μ΄ν°λ₯Ό κ°κ³΅νμ¬ μ»μ κ²°κ³Ό, μμ¬κ²°μ μ κΈ°μ¬
μ λμ λ°μ΄ν°(Quantitative Data): μΈμ΄, λ¬Έμ λ±μ΄ κ³λ κ°λ₯ νν / (κ·Έλ¦μ΄ μ ν΄μ Έμμ΄μΌν¨) β μ ν, λ°μ ν λ°μ΄ν° νν
μ μ±μ λ°μ΄ν°(Qualitative Data): μΈμ΄, κ°λ λ± μΆμμ νν / λΉμ ν λ°μ΄ν° νν
λΉ λ°μ΄ν°μ μμ§
μ μ : μμ€ν μ λ΄μΈλΆμμ μ£ΌκΈ°μ±μ κ°μ§κ³ νμν ννλ‘ λ°μ΄ν°λ₯Ό λͺ¨μΌλ μμ
μν
- μ μ©ν λ°μ΄ν°λ₯Ό μ ν β μ°μΆλ¬Ό νμ§ ν₯μ
- μ΅μ μ λ°©λ²λ‘ μ ν β μμ§ μμ μ± κ·Ήλν
- μμ§ μμ λΉμ© μ΅μν
λΉ λ°μ΄ν° μμ§ μ μ°¨ μ€κ³
- μμ§ λ°μ΄ν° μ μ - λ€μν μμλ₯Ό κ³ λ €νλ € μ μ
- μΈλΆκ³ν μ립 - μμΉ, μ νμ λ°λ₯Έ κ³νμ μμ±
- ν μ€νΈ μμ§ μ§ν - ν μ€νΈλ₯Ό ν΅ν΄ κΈ°μ / νμ κ²ν
- μμ§ μ§ν
μμ§ λ°μ΄ν° μ μ
κ°λ₯μ± : λΆκ°λ₯ νΉμ μ£ΌκΈ° ν΅μ κ°λ₯ μ¬λΆ νμΈ
μ νμ± : λ΄μ© μ νμ±/μ λ°μ±, μ¬μ μ²λ¦¬ νμ μ¬λΆ
λμ΄λ : λΉμ©, μμ§ κ³Όμ μ λ°λ₯Έ λμ κ³ λ €
λΉμ© : λ°μ΄ν° νλμ νμν μ§μ λΉμ© κ²ν
보μ : κ°μΈμ λ³΄λ³΄νΈ λ° μ μκΆ λ¬Έμ κ²ν
μΈλΆκ³ν μ립
λ°μ΄ν°μ μμΉμ μ ν νμ : λ΄λΆ νΉμ μΈλΆ λ°μ΄ν° μ¬λΆνμΈ β κΈ°κ΄ νμ κ³ λ €
νΉμ§, ꡬμ±, νν λ± νμ β λ°©λ²λ‘ μ νμ μν₯
μμ§ κ³νμ μμ±
λ°μ΄ν° μμ€, μμ§ μ£ΌκΈ°, μμ§ λ°©λ²μ ν¬ν¨νμ¬ μμ± (λ°λμ ν¬ν¨)
ν μ€νΈ μμ§ μ§ν
κΈ°μ μ κ²ν : λ°μ΄ν° λλ½, μλ³Έ λ°μ΄ν°μ λΉκ΅, μ νμ± μΈ‘μ
νμ μ κ²ν : 보μμ±, μ μκΆ, νΈλν½ λ°μλλ±
λΉ λ°μ΄ν° μμ§ κ³νμ
λ°μ΄ν° μμ€ : μμ€ μμΉ, νν, μΈν°νμ΄μ€ , μ€λ¬΄μ νμ½ μμΈ
μμ§ μ£ΌκΈ°: μ£ΌκΈ°μκ°(κ·μΉμ±) λλ μ€μκ°(λΆκ·μΉμ±), λ°μ΄ν°/νΈλν½λ
μμ§ λ°©λ²: μμ§ κΈ°μ , μ¬μ /μ¬νμ²λ¦¬,λμ
λΉ λ°μ΄ν° μμ§ λꡬ
μΈμ μμ νμ© :
- μ¬λμ ν΅νμ¬ λ°μ΄ν° μμ§
- μΈμ μμ λΉμ© λ°μ
- μ€ν΄μ λλ μ€μ°¨λ±μ λ¬Έμ μ
μλν λꡬ μ¬μ©:
- λλΆλΆμ κ³Όμ μμ μ¬λμ κ°μ μμ
- μΈμ μμ λΉμ© μ΅μν κ°λ₯
- λ°μ΄ν° μμ²μ ννμ λ°λΌ μ μ©μ΄ λΆκ°λ₯ν μλ μμ
λΉ λ°μ΄ν° μλν μμ§ κΈ°μ
λ€νΈμν¬ μμ§
- ν¬λ‘€λ§(Crawling): μ¬μ μ μ ν¨ν΄μ λ°λΌ μ ν΄μ§ λ€νΈμν¬ μ§μ μ λ°μ΄ν° μμ§
- OpenAPI: λ°μ΄ν° λ°°ν¬μ μ 곡 μΈν°νμ΄μ€
λ‘κ·Έ/ μΌμ μμ§
- λ‘κ·Έ (Log)μμ§: κΈ°κ΄ λ¨μ²΄ λ΄λΆμ μμ§ / μλ λλ μ΄μ© ν¨ν΄μ κΈ°λ‘
- μΌμ (Sensor)μμ§ : μΌμ μ₯μΉλ₯Ό μ΄μ©ν κΈ°λ‘
μμ§ μ¬λ‘
JSON(Javascript Object Notation):
- XML μ μ¬ λ°μ΄ν° μ νν λ°©μ
- μΈν°λ· μμ λ°μ΄ν° μ‘μμ λ°©μ
- ν μ€νΈ νν, μμ μ©λ, λΉ λ₯Έ λ³ν μλ
- νλ‘κ·Έλλ° μΈμ΄ λλ νλ«νΌ λ 립μ
Flume:
- 2010λ Cloudera κ°λ°, λ‘κ·Έ λ°μ΄ν° μμ§κΈ°
- λΆμ° λ°μ΄ν° ν΅ν© κ°λ₯, μμ μ± κ°μ©μ± λμ
Chukwa(μ²μ):
- 2008λ Yahoo κ°λ°, λ‘κ·Έ λ°μ΄ν° μμ§κΈ°
- μνμΉ νλ‘ κΈ°λ°, μ€μκ° λΆμ κΈ°λ₯
SQOOP(μ€μΏ±):
- SQI-to-hadOOP, λ€μν DBMS λ²€ν° νΈν
- DBMS, νλ‘, NoSQL κ° λ°μ΄ν° μ°λμ μ μ©
OpenRefine(μ€ν 리νμΈ):
- 2010λ Googleμ μ€ν νλ‘μ νΈ
- λ°μ΄ν° μ μ λꡬ: μ€λ₯ μμ , λ°μ΄ν° μ 리
- λ°μ΄ν° μ°κ³ API λ° μν¬ νλ‘μ° κΈ°λ₯ μ 곡
Protocol Buffers( νλ‘ν μ½ λ²νΌ):
- Googleμ μ€ν μμ€ μ§λ ¬ν λΌμ΄λΈλ¬λ¦¬
- λ€μν νλ«νΌ κ°μ ν΅μ κ°λ₯
'π» IT > λΉ λ°μ΄ν°' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
λΉ λ°μ΄ν° λΆμ λꡬ R (3) (1) | 2024.04.20 |
---|---|
λΉ λ°μ΄ν° λΆμ λꡬ R (2) (1) | 2024.04.20 |
λΉ λ°μ΄ν° λΆμ λꡬ R (1) (0) | 2024.04.19 |
λΉ λ°μ΄ν° μ μ₯μ (1) | 2024.04.18 |
λΉ λ°μ΄ν°μ κ°λ (0) | 2024.04.17 |