1) ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ํ์์ฑ
(1) ๋ฐ์ดํฐ์ ์ ๋ณด
- ๋ฐ์ดํฐ๋ ํ์ค ์ธ๊ณ์์ ๋จ์ํ ๊ด์ฐฐํ๊ฑฐ๋ ์ธก์ ํ์ฌ ์์งํ ์ฌ์ค (Fact)์ด๋ ๊ฐ (Value)์ ์๋ฏธํ๋ฉฐ ์๋ฃ ๋ผ๊ณ ๋ ๋ถ๋ฆฌ์ด๋ค.
- ์ ๋ณด๋ ๋ฐ์ดํฐ๋ฅผ ์์ฌ ๊ฒฐ์ ์ ์ ์ฉํ๊ฒ ํ์ฉํ ์ ์๋๋ก ์ฒ๋ฆฌํ์ฌ ์ฒด๊ณ์ ์ผ๋ก ์กฐ์งํ ๊ฒฐ๊ณผ๋ฌผ์ด๋ค.
- ๋ฐ์ดํฐ์์ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ๊ณผ์ ๋๋ ๋ฐฉ๋ฒ์ ์ ๋ณด ์ฒ๋ฆฌ (Information Processing)๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ, ๋ฐ์ดํฐ๋ฅผ ์ํฉ์ ๋ง๊ฒ ๋ถ์ํ๊ฑฐ๋ ํด์ํ์ฌ ๋ฐ์ดํฐ ๊ฐ์ ์๋ฏธ ๊ด๊ณ๋ฅผ ํ์ ํ๋ ๊ฒ์ด๋ค.
(2) ๋ฐ์ดํฐ๋ฅผ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ ์ฅ
- ํ๋์ฌํ์์ ๊ฐ์ธ์ด๋ ์กฐ์ง์ ์ฑ๊ณต ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ์ง๋ ์ค์ํ ์์๋ ์ ๋ณด์ด๋ฉฐ ์ด๋ ์ ๋ณด๊ฐ ๊ฐ์ธ์ด๋ ์กฐ์ง์ด ์ฌ๋ฐ๋ฅธ ์์ฌ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋๋ฐ ์ค์ํ ํ๋จ ๊ธฐ์ค์ด ๋๊ธฐ ๋๋ฌธ์ด๋ค.
- ๊ทธ๋ฆฌ๊ณ ๊ฐ์น ์๋ ์ ๋ณด๋ฅผ ์ป๊ธฐ ์ํด์๋ ํ์ฌ ์ํฉ์ ์ ํํ ๊ด์ฐฐํ๊ณ ์ธก์ ํ์ฌ ์๋ฏธ ์๋ ๋ฐ์ดํฐ๋ฅผ ๋ง์ด ์์งํด์ผ ํ๋ค.
- ๋ํ, ์์งํ ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ ์ฅํ๋ค๊ฐ ํ์ํ ๋ ์ธ์ ๋ ์ฌ์ฉํ ์ ์์ด์ผ ํ๋ ๋ฑ ์ด๋ฌํ ๊ฒ๋ค์ ๋ชจ๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค๊ฐ ๋์ ๊ด๋ฆฌํด์ค๋ค!
2) ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ ์์ ํน์ง
(1) ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ ์
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ผ๋ ์ฉ์ด๋ 1963๋ ์ปดํจํฐ ์ค์ฌ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฐ๋ฐ๊ณผ ๊ด๋ฆฌ (Development and Management of a Computer-centered Data Base) ์ฌํฌ์ง์์์ ๊ณต์์ ์ผ๋ก ์ฒ์ ์๊ฐ๋์๋ค.
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์ฝ๊ฒ ๋งํด ๊ด๋ จ์๋ ๋ฐ์ดํฐ๋ฅผ ๋ชจ์๋๋ ์ฐฝ๊ณ ๋ก ์๊ฐํ ์ ์์ง๋ง ์๋ฏธ๋ฅผ ๋ณด๋ค ์ ํํ ํ์ ํ๊ธฐ ์ํด ๋๋ฆฌ ํต์ฉ๋๋ ์ ์๋ฅผ ๋ณด์!
์ผ๋ฐ์ ์ผ๋ก ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ํน์ ์กฐ์ง์ ์ฌ๋ฌ ์ฌ์ฉ์๊ฐ '๊ณต์ 'ํ์ฌ ์ฌ์ฉํ ์ ์๋๋ก 'ํตํฉ'ํด์ '์ ์ฅ'ํ '์ด์' ๋ฐ์ดํฐ์ ์งํฉ์ด๋ค.
๊ณต์ ๋ฐ์ดํฐ (Shared Data)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ํน์ ์กฐ์ง์ ์ฌ๋ฌ ์ฌ์ฉ์๊ฐ ํจ๊ป ์์ ํ๊ณ ์ด์ฉํ ์ ์์ด์ผ ํ๋ ๊ณต์ฉ ๋ฐ์ดํฐ์ด๋ค.
ํตํฉ ๋ฐ์ดํฐ (Integrated Data)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋ฐ์ดํฐ ์ค๋ณต์ฑ (Data Redundancy), ์ฆ ๋๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์ฌ๋ฌ ๊ฐ ์กด์ฌํ๋ ๊ฒ์ ํ์ฉํ์ง ์๋๋ค.
- ๋ฐ์ดํฐ๊ฐ ์ค๋ณต๋๋ฉด ๊ด๋ฆฌํ๊ธฐ ์ด๋ ค์ด ๋ฌธ์ ๊ฐ ๋ฐ์ํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
- ํ์ง๋ง ํจ์จ์ฑ ๋๋ฌธ์ ์ค๋ณต์ ์๋์ ์ผ๋ก ํ์ฉํ๋ ๊ฒฝ์ฐ๋ ์์ผ๋ฏ๋ก ํตํฉ ๋ฐ์ดํฐ๋ ๋ฐ์ดํฐ์ ์ค๋ณต์ ์ต์ํํ๊ณ ํต์ ๊ฐ ๊ฐ๋ฅํ ์ค๋ณต๋ง ํ์ฉํ๋ ๋ฐ์ดํฐ๋ผ๋ ์๋ฏธ๋ก ์ดํดํ์!
์ ์ฅ ๋ฐ์ดํฐ (Stored Data)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ฐ์ดํฐ๋ ์ฃผ๋ก ์ปดํจํฐ๊ฐ ์ฒ๋ฆฌํ๋ฏ๋ก, ์ปดํจํฐ๊ฐ ์ ๊ทผํ ์ ์๋ ๋งค์ฒด์ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ์ ์ฅํด์ผ ํ๋ค.
์ด์ ๋ฐ์ดํฐ (Operational Data)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์กฐ์ง์ ์ด์ํ๊ณ ์กฐ์ง์ ์ฃผ์ ๊ธฐ๋ฅ์ ์ํํ๊ธฐ ์ํด ๊ผญ ํ์ํ๋ค.
- ์ผ์์ ์ผ๋ก ์ฌ์ฉํ๊ณ ๋ง๋ ๊ฒ์ด ์๋, ์ง์์ ์ผ๋ก ์ ์งํด์ผ ํ๋ ๋ฐ์ดํฐ์ด๋ค!
(2) ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ํน์ง
- ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ํ ์ ์๋ฅผ ๋ฐํ์ผ๋ก ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ฃผ์ ํน์ง์ ์ดํด ๋ณด์!
์ค์๊ฐ ์ ๊ทผ (Real-time Accessibility)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์ฌ์ฉ์์ ๋ฐ์ดํฐ ์๊ตฌ์ ์ค์๊ฐ์ผ๋ก ์๋ตํ ์ ์์ด์ผ ํ๋ค.
- ์ค์๊ฐ ์ฒ๋ฆฌ์์๋ ์ฌ์ฉ์์ ๊ฐ์ธ ํน์ฑ์ด๋ ์ ๊ณต๋๋ ์๋น์ค ์ ํ์ ๋ฐ๋ผ ํ์ฉ๋๋ ์๋ต ์๊ฐ์ ๋ค ๋ค๋ฅด๊ฒ ์ง๋ง ๋๊ฐ ๋ช ์ด๋ฅผ ๋์ง ์๋ ์๊ฐ ๋ด์ ๋ฐ์ดํฐ๋ฅผ ์ ๊ณตํด์ผ ํ๋ค!!
์ง์์ ์ธ ๋ณํ (Continuous Evolution)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ํ์ค ์ธ๊ณ์ ์ํ๋ฅผ ์ ํํ ๋ฐ์ํด์ผ ์๋ฏธ๊ฐ ์๋๋ฐ ๋ค๋ง ํ์ค ์ธ๊ณ๋ ๋์์์ด ๋ณํ๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์ ์ฅ๋ ๋ฐ์ดํฐ๋ ํ์ค์ ๋ง์ถ์ด ๊ณ์ ๋ณํด์ผ ํ๋ค.
- ์ฆ, ์ ๋ฆฌํ์๋ฉด ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋์ ์ด๋ฏ๋ก ๋ฐ์ดํฐ๋ฅผ ๊ณ์ ์ฝ์ , ์ญ์ , ์์ ํ์ฌ ํ์ฌ์ ์ ํํ ๋ฐ์ดํฐ๋ฅผ ์ ์งํด์ผ ํ๋ค๋ ๊ฒ์ด๋ค!
๋์ ๊ณต์ (Concurrent Sharing)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์ฌ๋ฌ ์ฌ์ฉ์๊ฐ ๋์์ ์ด์ฉํ ์ ์๋ ๋์ ๊ณต์ ์ ํน์ง์ ์ ๊ณตํด์ผ ํ๋ค.
๋ด์ฉ์ผ๋ก ์ฐธ์กฐ (Content Reference)
- ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ์ ์ฅ๋ ์ฃผ์๋ ์์น๊ฐ ์๋ ๋ฐ์ดํฐ์ ๋ด์ฉ (Content), ์ฆ ๊ฐ์ผ๋ก ์ฐธ์กฐํ ์ ์๋ค.
- ์ผ๋ฐ์ ์ผ๋ก ์ปดํจํฐ์ ์ ์ฅ๋ ๋ฐ์ดํฐ๋ ์ ์ฅ ์ฃผ์๋ฅผ ์์์ผ ๊ฒ์์ด ๊ฐ๋ฅํ ๋ฐ๋ฉด ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋ฐ์ดํฐ์ ๋ด์ฉ๋ง์ผ๋ก๋ ๊ฒ์์ด ๊ฐ๋ฅํ๋ค
- ์๋ฅผ ๋ค์ด, '์ฌ๊ณ ๋์ด 500๊ฐ ์ด์์ธ ์ ํ์ ์ด๋ฆ์ ๊ฒ์ํ์ธ์' ์ฒ๋ผ ์ฐพ๊ณ ์ ํ๋ ๋ฐ์ดํฐ์ ๋ด์ฉ ์กฐ๊ฑด๋ง ์ ์ํ๋ฉด ์กฐ๊ฑด์ ๋ง๋ ๋ฐ์ดํฐ๊ฐ ์๋ก ๋ค๋ฅธ ์์น์ ์ ์ฅ๋์ด ์์ด๋ ๋ชจ๋ ๊ฒ์ํ ์ ์๋ค.
3) ๋ฐ์ดํฐ ๊ณผํ ์๋์ ๋ฐ์ดํฐ
(1) ํํ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ ๋ถ๋ฅ
- ๋ฐ์ดํฐ๋ ๊ตฌ์กฐํ๋ ํํ์ ๋ฐ๋ผ ์ ํ ๋ฐ์ดํฐ, ๋ฐ์ ํ ๋ฐ์ดํฐ, ๋น์ ํ ๋ฐ์ดํฐ๋ก ๋ถ๋ฅํ ์ ์๋ค.
์ ํ ๋ฐ์ดํฐ (Structed Data)
์ ํ ๋ฐ์ดํฐ๋ ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ, ์ฆ ๋ฏธ๋ฆฌ ์ ํด์ง ๊ตฌ์กฐ์ ๋ฐ๋ผ ์ ์ฅ๋ ๋ฐ์ดํฐ๋ฅผ ๋งํ๋ค.
- ๋ํ์ ์ธ ์์๋ก ์์ ์ ์คํ๋ ๋์ํธ, ๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ํ ์ด๋ธ์ด ์๋ค.
[Note] ์คํค๋ง
๋ฏธ๋ฆฌ ์ ํด์ง ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ฅผ ์คํค๋ง (Schema)๋ผ๊ณ ๋ถ๋ฅธ๋ค.
๋ฐ์ ํ ๋ฐ์ดํฐ (Semi-Structed Data)
๋ฐ์ ํ ๋ฐ์ดํฐ๋ ๊ตฌ์กฐ์ ๋ฐ๋ผ ์ ์ฅ๋ ๋ฐ์ดํฐ์ด์ง๋ง ์ ํ ๋ฐ์ดํฐ์ ๋ฌ๋ฆฌ ๋ฐ์ดํฐ ๋ด์ฉ ์์ ๊ตฌ์กฐ์ ๋ํ ์ค๋ช ์ด ํจ๊ป ์กด์ฌํ๋ค.
- ๋ฐ์ดํฐ ๋ด์ฉ ์์ ๊ตฌ์กฐ์ ๋ํ ์ค๋ช ์ด ํจ๊ป ๋ค์ด ์์ด ๊ตฌ์กฐ๋ฅผ ํ์ ํ๋ ํ์ฑ (Parsing) ๊ณผ์ ์ด ํ์ํ๊ณ , ๋ณดํต ํ์ผ ํํ๋ก ์ ์ฅ๋๋ค.
- ๋ํ์ ์ธ ์์๋ก ์น์์ ๋ฐ์ดํฐ๋ฅผ ๊ตํํ๊ธฐ ์ํด ์์ฑํ๋ HTML, XML, JSON ๋ฌธ์ ๋ฑ์ด ์๋ค.
[Note] ๋ฉํ ๋ฐ์ดํฐ (Metadata)
๋ด์ฉ๊ณผ ํจ๊ป ์ค๋ช
๋ ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ฅผ ์คํค๋ง ๋ผ๊ณ ๋ ํ์ง๋ง ๋ฉํ ๋ฐ์ดํฐ ๋ผ๊ณ ๋ ํ๋ค.
๋น์ ํ ๋ฐ์ดํฐ (Unstructed Data)
๋น์ ํ ๋ฐ์ดํฐ๋ ์ ํด์ง ๊ตฌ์กฐ๊ฐ ์์ด ์ ์ฅ๋ ๋ฐ์ดํฐ๋ฅผ ๋งํ๋ค.
- ๋ํ์ ์ธ ์์๋ก ์์ ๋ฐ์ดํฐ์ ํ ์คํธ, ์์, ์ด๋ฏธ์ง, ์์ฑ, ์๋๋ PPT ๋ฌธ์ ๋ฑ์ด ์๋ค.
(2) ํน์ฑ์ ๋ฐ๋ฅธ ๋ฐ์ดํฐ ๋ถ๋ฅ
- ๋ฐ์ดํฐ๋ ํน์ฑ์ ๋ฐ๋ผ ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ ์์นํ ๋ฐ์ดํฐ๋ก ๋ถ๋ฅํ ์ ์๋ค.
๋ฒ์ฃผํ ๋ฐ์ดํฐ (Categorical Data)
๋ฒ์ฃผํ ๋ฐ์ดํฐ๋ ๋ฒ์ฃผ (Category)๋ก ๊ตฌ๋ถํ ์ ์๋ ๊ฐ, ์ฆ ์ข ๋ฅ๋ฅผ ๋ํ๋ด๋ ๊ฐ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์๋ฏธํ๋ค.
- ๋ํ, ๋ฒ์ฃผํ ๋ฐ์ดํฐ๋ ๋ช ๋ชฉํ ๋ฐ์ดํฐ์ ์์ํ ๋ฐ์ดํฐ๋ก ๋ค์ ์ธ๋ถํ ํ ์ ์๋๋ฐ ๋ช ๋ชฉํ ๋ฐ์ดํฐ๋ ์์ด์ด ์๋ ๊ฐ์ ๊ฐ์ง๋ ๋ฐ์ดํฐ์ด๊ณ ์์ํ ๋ฐ์ดํฐ๋ ์์ด์ด ์๋ ๊ฐ์ ๊ฐ์ง๋ ๋ฐ์ดํฐ๋ฅผ ๋งํ๋ค.
- ์๋ฅผ ๋ค์ด, ํ์กํ, ๊ฑฐ์ฃผ ์ง์ญ, ์์ ์ฅ๋ฅด ๋ฑ์ ๋ช ๋ชฉํ ๋ฐ์ดํฐ์ ํด๋นํ๊ณ ํ๋ , ํ์ ๋ฑ๊ธ, ํ์ ๋ฑ์ด ์์ํ ๋ฐ์ดํฐ์ ํด๋นํ๋ค.
- ๊ทธ๋ฆฌ๊ณ ๋ฒ์ฃผํ ๋ฐ์ดํฐ๋ ๋๋ถ๋ถ ๋ฌธ์ ํ์ ์ ๊ฐ์ผ๋ก ์์ ์ธก๋ฉด์์ ํฌ๊ธฐ ๋น๊ต์ ์ฐ์ ์ ์ธ ์ฐ์ฐ์ด ๊ฐ๋ฅํ์ง ์๊ธฐ ๋๋ฌธ์ ์ง์ ๋ฐ์ดํ (Qualitative Data) ๋ผ๊ณ ๋ ๋ถ๋ฅธ๋ค.
์์นํ ๋ฐ์ดํฐ (Numerical Data)
์์นํ ๋ฐ์ดํฐ๋ ์์ ์ธก๋ฉด์์ ํฌ๊ธฐ ๋น๊ต์ ์ฐ์ ์ ์ธ ์ฐ์ฐ์ด ๊ฐ๋ฅํ ์ซ์ ๊ฐ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์๋ฏธํ๋ค.
- ๋ํ, ์์นํ ๋ฐ์ดํฐ๋ ์ด์ฐํ ๋ฐ์ดํฐ์ ์ฐ์ํ ๋ฐ์ดํฐ๋ก ๋ค์ ์ธ๋ถํ ํ ์ ์๋๋ฐ ์ด์ฐํ ๋ฐ์ดํฐ๋ ๋จ์ ๋ ์ซ์ ๊ฐ์ ๊ฐ์ง๋ ๋ฐ์ดํฐ์ด๊ณ ์ฐ์ํ ๋ฐ์ดํฐ๋ ์ฐ์์ ์ผ๋ก ์ด์ด์ง ์ซ์ ๊ฐ์ ๊ฐ์ง๋ ๋ฐ์ดํฐ๋ฅผ ๋งํ๋ค.
- ์๋ฅผ ๋ค์ด, ๊ณ ๊ฐ ์, ํ๋งค๋, ํฉ๊ฒฉ์ ์ ๋ฑ์ด ์ด์ฐํ ๋ฐ์ดํฐ์ ํด๋นํ๊ณ ํค, ๋ชธ๋ฌด๊ฒ, ์จ๋, ์ ์ ๋ฑ์ด ์ฐ์ํ ๋ฐ์ดํฐ์ ํด๋นํ๋ค.
- ๊ทธ๋ฆฌ๊ณ ์์นํ ๋ฐ์ดํฐ๋ ๋ฒ์ฃผํ ๋ฐ์ดํฐ์ ๋ฌ๋ฆฌ ํฌ๊ธฐ ๋น๊ต์ ์ฐ์ ์ ์ธ ์ฐ์ฐ์ด ๊ฐ๋ฅํ์ฌ ์์ ๋ฐ์ดํฐ (Quantitative Data) ๋ผ๊ณ ๋ ๋ถ๋ฅธ๋ค.
[Reference]
- ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฐ๋ก (๊น์ฐํฌ)
'๐ป Computer Science > Database' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฐ๋ก - ๋ฐ์ดํฐ๋ฒ ์ด์ค ์์คํ (0) | 2024.04.07 |
---|---|
๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฐ๋ก - ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ด๋ฆฌ ์์คํ (1) | 2024.04.03 |