정보처리기사 3과목 데이터베이스 구축 - 2장 물리 데이터베이스 설계 요점 정리

정보처리기사 필기

정보처리기사 3과목 데이터베이스 구축 - 2장 물리 데이터베이스 설계 요점 정리

E_ONION 2020. 6. 4. 03:18

1. 사전 조사 분석

● 물리 DB 설계

: 논리적 구조로 표현된 논리적 DB를 디스크 등의 물리적 저장 장치에 저장할 수 있는 물리적 구조의 데이터로 변환하는 과정

- 데이터 단위 : 레코드

- 물리적 설계 단계에서 필수 수행 사항 : 저장 레코드의 양식 설계, 레코드 집중의 분석 및 설계, 접근 경로 설계

- 물리적 DB 구조는 여러 가지 타입의 저장 레코드 집합이라는 면에서 단순한 파일과 다름

- 고려 사항 : 인덱스 구조, 레코드 크기, 존재 레코드 수, 트랜잭션의 갱신과 참조 성향, 성능 향상을 위한 개념 스키마 변경 여부 검토, 빈번한 질의와 트랜잭션들의 수행 속도를 높이기 위한 고려, 시스템 운용 시 파일 크기의 변화 가능성

- 물리적 설계 옵션 : 반응시간, 공간 활용도, 트랜잭션 처리량

● 데이터 명명 규칙 파악

- 물리 데이터 모델에 적용해야 하는 규칙, 설계 전에 파악

- 데이터 표준화 및 논리 DB 설계의 결과물들을 통해 파악

- 물리 논리 DB 설계에 적용되는 명명 규칙은 서로 일관성을 유지

- 명명 규칙 파악하려면 도메인과 데이터 사전에 대한 지식 필요, 중복 구축 방지 가능

● 시스템 자원 파악

- DB 설치에 영향을 미칠 수 있는 물리적인 요소

- HW 자원, 운영체제 및 DBMS 버전, DBMS 파라미터 정보 등으로 구분

● DB 관리 요소 파악

- DB 운영과 관련된 관리 요소, DB 관리 요소 파악한 후 이를 기반으로 시스템 조사 분석서를 작성

- DB 구조, 이중화 구성, 분산 DB, 접근 제어 / 접근 통제, DB 암호화

2. DB 저장 공간 설계

● 테이블 : DB의 가장 기본적인 객체로 행(ROW), 열(COLUMN)로 구성

- DB 모든 데이터 테이블에 저장, 논리 설계 단계의 개체(Entity)에 대응하는 객체

● 일반 테이블 : 대부분의 DBMS에서 표준 테이블로 사용, 임의의 방식으로 데이터 관리하는 힙 구조 테이블

- 테이블에 저장되는 데이터의 행(로우) 위치는 데이터가 저장되는 순서에 따라 결정

● 클러스터드 인덱스 테이블 : 기본키나 인덱스 키의 순서에 따라 데이터 저장되는 테이블

- 일반적인 인덱스를 사용하는 테이블에 비해 접근 경로가 단축

● 파티셔닝 테이블 : 대용량의 테이블을 작은 논리적 단위인 파티션으로 나눈 테이블

- 대용량 데이터 효과적 관리 가능, 파티션 키 잘못 구성 시 성능 저하 등 역효과 초래

- 범위 분할(지정한 열을 기준), 해시 분할, 조합 분할(범위 분할로 분할 후 해시 함수 적용하여 다시 분할)

● 외부 테이블 : DB에서 일반 테이블처럼 이용할 수 있는 외부 파일, DB 내에 객체로 존재

- 데이터 웨어하우스, ETL 등의 작업에 유용하게 사용

● 임시 테이블 : 트랜잭션이나 세션별로 데이터를 저장하고 처리할 수 있는 테이블

- 저장된 데이터는 트랜잭션이 종료되면 삭제, 절차적인 처리를 위해 임시로 사용

● 칼럼 : 테이블 열, 데이터 타입, 길이 등으로 정의, 데이터 타입은 데이터의 일관성 유지를 위해 사용되는 가장 기본

- 도메인을 정의한 경우 도메인에 따라 데이터의 타입과 길이가 정의

- 두 칼럼을 비교하는 연산에서 두 칼럼의 데이터 타입이나 길이가 다르면 DBMS 내부적으로 변환 후 비교 연산 수행

- 참조 관계인 칼럼들은 데이터 타입과 길이가 일치해야 함

● 테이블 스페이스 : 테이블이 저장되는 논리적인 영역, 하나의 테이블 스페이스에 하나 or 그 이상의 테이블 지정 가능

- 테이블 저장하면 논리적으론 테이블 스페이스, 물리적으론 연관된 데이터 파일에 저장

- 테이블, 테이블 스페이스, 데이터 파일로 나눠 관리하면 논리적 구성이 물리적 구성에 종속되지 않아 투명성 보장

- DB에 저장되는 내용에 따라 테이블, 인덱스, 임시 등의 용도로 구분하여 설계

- 고려사항 : 업무별로 구분하여 지정, 대용량 테이블 = 독립적으로 저장, 테이블과 인덱스 분리하여 저장

LOB 타입의 데이터는 독립적인 공간으로 지정

3. 트랜잭션

- 정의 : DB 상태를 변환 시키는 하나의 논리적인 기능을 수행하기 위한 작업 단위, 한꺼번에 수행되어야 할 일련의 연산

- DB 시스템에서 병행 제어 및 회복 작업 시 처리되는 작업의 논리적인 단위

- 사용자가 시스템에 대한 서비스 요구 시 시스템이 응답하기 위한 상태 변환 과정의 작업 단위

● 특성 : 무결성 보장 위해 트랜잭션이 가져야 할 특성

- Atomicity(원자성) : 완료 or 복구, 완벽 수행 or 전부 취소

- Consistency(일관성) : 성공적 완료 시 언제나 일관성 있는 DB 상태로 변환, 트랜잭션 수행 전 수행 후 상태 같아야 함

- Isolation(독립성, 격리성, 순차성) : 트랜잭션 실행 중 다른 트랜잭션 연산 못 끼어듬, 완전 완료 전까지 참조 X

- Durability(지속성) : 성공적으로 완료된 트래잭션의 결과는 영구적으로 유지, 반영되어야 함

● CRUD 분석 : DB 테이블에 변화 주는 트랜잭션 연산 중 생성, 읽기, 갱신, 삭제의 연산에 대해 CRUD 매트릭스 작성하여 분석

: 구조 최적화 목적, 트랜잭션의 주기별 발생 횟수 파악하고 연관된 테이블 분석하면 테이블에 저장되는 데이터의 양 유추(예측) 가능

- CRUD 분석 통해 트랜잭션 몰리는 테이블 파악 가능하므로 디스크 구성 시 유용한 자료 활용 가능

- 연결 지연이나 타임아웃 오류 방지 가능(분산 기능)

● CRUD 매트릭스 : 2차원 표로서 행에는 프로세스 열에는 테이블, 행과 열이 만나는 위치에는 프로세스가 테이블에

발생시키는 변화를 표시하는 업무 프로세스와 데이터 간 상관 분석표

- CRUD 매트릭스를 통해 프로세스의 트랜잭션이 테이블에 수행하는 작업을 검증

- CRUD 매트릭스의 각 셀에는 C R U D가 들어가고 복수의 작업 시 우선순위 C D U R 적용

- CRUD 매트릭스 완성 시 C R U D 어느 것도 적히지 않은 행 or 열, C R이 없는 행을 확인 후 불필요, 누락된 테이블, 프로세스 찾음

● 트랜잭션 분석 : 테이블에 발생하는 트랜잭션 양을 분석하고, 테이블에 저장되는 데이터양 유추하고, 이를 근거로 DB 용량 산정 및 DB 구조 최적화하는 것

- 업무 개발 담당자가 수행, 여러 디스크에 배치함으로써 디스크 입 출력 분산을 통한 성능 향상

● 트랜잭션 분석서 : 단위 프로세서와 CRUD 매트릭스 이용하여 작성

- 구성요소 : 단위 프로세스, CRUD 연산, 테이블명, 칼럼명, 테이블 참조 횟수, 트랜잭션 수, 발생 주기 등

4. 인덱스 설계 (인덱스 개념과 각 인덱스 특징)

- 인덱스 : 데이터 레코드 빠르게 접근하기 위해 <키값, 포인터> 쌍으로 구성되는 구조

- 데이터가 저장된 물리적 구조와 밀접한 관계, 하나 이상의 필드로 만들어도 됨, 액세스 빠르게 수행 가능

- 물리적인 구조에 접근 방법 제공, 레코드 삽입 삭제 빈번한 경우 인덱스 개수 최소로 하는 것이 효율적

- 인덱스 없으면 특정한 값 찾기 위해 모든 데이터 페이지를 확인하는 TABLE SCAN이 발생

- 클러스터드 인덱스 : 인덱스 키의 순서에 따라 데이터가 정렬되어 저장되는 방식,

레코드의 물리적 순서가 인덱스의 엔트리 순서와 일치

- 넌클러스터드 인덱스 : 인덱스의 키값만 정렬되어 있을 뿐 실제 데이터는 정렬되지 않는 방식

● 트리 기반 인덱스 : 인덱스 지정 블록들이 트리 구조 이루고 있는 것, 상용 DBMS에서는 트리 구조 기반 B+ 트리 인덱스 주로 씀

- B 트리 인덱스 : 일반적 사용하는 인덱스 방식, 루트 노드에서 하위 노드로 키값의 크기 비교하며 데이터 검색 모든 리프 노드 레벨 동일

- B+ 트리 인덱스 : 노드로 구성된 인덱스 세트와 단말 노드로만 구성된 순차 세트로 구분, 인덱스 세트에 있는 노드들은 단말 노드에 있는 키값을 찾아갈 수 있는 경로로만 제공, 순차 세트에 있는 단말 노드가 해당 데이터 레코드 주소 가리킴,

인덱스 세트에 있는 모든 키값이 단말 노드에 다시 나타나므로 단말 노드 만을 이용한 순차 처리 가능

● 비트맵 인덱스 : 인덱스 칼럼의 데이터를 Bit 값인 0 or 1로 변환하여 인덱스 키로 사용하는 방법

- 키값을 포함하는 로우(행)의 주소 제공, 데이터가 Bit로 구성되어 있어 효율적인 논리 연산이 가능하고 저장 공간이 작음

- 분포도가 낮은 칼럼에 적합하여 성능 향상 효과 기대, 다중 조건 만족하는 튜플의 개수 계산에 적합, 압축 효율 좋음

● 함수 기반 인덱스 : 칼럼의 값 대신 칼럼의 특정 함수나 수식을 적용하여 산출된 값을 사용

- B+ 트리 인덱스 or 비트맵 인덱스를 생상하여 사용, 부하 발생 가능, 사용자 정의 함수가 시스템 함수보다 부하 더 큼

- 대소문자, 띄어쓰기 등 상관없는 조회할 때 유용하게 사용

● 비트맵 조인 인덱스 : 다수의 조인된 객체로 구성된 인덱스, 비트맥 인덱스와 물리적 구조 동일

● 도메인 인덱스 : 개발자가 필요한 인덱스 직접 만들어 사용하는 것으로 확장형 인덱스라고 함

● 인덱스 설계 : 인덱스의 대상 테이블, 칼럼 등을 선정 -> 인덱스의 효율성을 검토하여 인덱스 최적화 수행 -> 인덱스 정의서 작성

● 인덱스 테이블 선정 기준 : MULTI BLOCK READ 수에 따라 판단, 랜덤 액세스 빈번 테이블,

특정 범위 특정 순서로 데이터 조회 필요 테이블, 다른 테이블과 순차적 조인 발생되는 테이블

● 인덱스 설계 시 고려사항

- 새로 추가되는 인덱스는 기존 액세스 경로에 영향 미칠 수 있음

- 인덱스를 지나치게 만들면 오버헤드 발생

- 넓은 범위를 인덱스로 처리 시 많은 오버헤드 발생

- 인덱스를 만들면 추가적인 저장공간 필요

- 인덱스와 테이블 데이터의 저장 공간이 분리되도록 설계

5. 뷰 설계(특징, 장단점)

- 가상 테이블, 물리적 존재 X, 사용자에게는 있는 것처럼 간주, 임시적인 작업 위한 용도로 활용

- 조인문 최소화로 사용자 편의성 최대화함

● 특징 : 기본 테이블과 같은 형태 구조 사용, 조작도 기본 테이블과 거의 같음

- 물리적 구현 X, 논리적 독립성 제공, 관리 용이 및 명령문 간단, 뷰를 통해서만 데이터에 접근하면 안전한 효율적 기법 사용 가능

- 뷰가 정의된 기본 테이블이나 뷰를 삭제 시 그 테이블이나 뷰를 기초로 정의된 다른 뷰도 자동으로 삭제

● 뷰의 장단점

- 장점

: 논리적 데이터 독립성 제공, 동시에 여러 사용자의 상이한 요구 지원, 데이터 관리 용이, 자동 보안 제공

- 단점

: 독립적 인덱스 가질 수 없음, 뷰의 정의 변경 불가, 삽입, 삭제, 갱신 연산 제약 따름

● 뷰의 설계 순서 : 대상 테이블 선정 -> 대상 칼럼 성정 -> 정의서 작성

● 뷰 설계 시 고려 사항 : 반복적으로 조인을 설정하여 사용하거나, 동일한 조건절을 사용하는 테이블을 뷰로 생성

- 다양한 관점에서 제시, 데이터의 보안 유지하며 설계

6. 클러스터 설계(개념과 특징)

:데이터 저장 시 데이터 액세스 효율 향상 위해 동일한 성격의 데이터를 데이터 블록에 저장하는 물리적 저장 방법

- 클러스터링 키로 지정된 칼럼 값의 순서대로 저장되고, 여러 개의 테이블이 하나의 클러스터에 저장

● 클러스터의 특징 : 데이터 조회 속도 향상, 데이터 입력 수정 삭제에 대한 성능 저하

- 데이터 분포도가 넓을수록 유리 => 저장 공간 절약

- 대용량을 처리 트랜잭션은 전체 테이블을 스캔하는 일 자주 발생하므로 클러스터링 지양

- 파니셔닝 된 테이블에는 적용 X

- 처리 범위 넓은 경우 = 단일 테이블 클러스터링, 조인이 많이 발생하는 경우 = 다중 테이블 클러스터링

- 디스크 입 출력 줄어듦, 클러스터링 된 테이블에 인덱스 생성 시 접근 성능 향상

● 클러스터 대상 테이블

: 분포도 넓은 테이블, 대량 범위 자주 조회 테이블, 입력 수정 삭제 자주 발생 X테이블, 자주 조인되어 사용되는 테이블

ORFER BY, GROUP BY, UNION이 빈번한 테이블

7. 파티션 설계(파티션 개요 바탕으로 파티션의 장단점, 종류 인덱스 파티션의 종류 파악)

● 개요 : 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것

- 파티셔닝 된 테이블은 물리적으로 별도의 세그먼트에 저장

- 대용량 DB의 경우 테이블들을 작은 단위로 나눠 분산시키면 성능 저하 방지, 데이터 관리 용이

- 데이터 처리는 테이블 단위, 데이터 저장은 파티션 별로 수행

● 파티션의 장단점

- 장점

: 쿼리 성능 향상, 디스크 성능 향상, 속도 향상, 손상 정도 최소화, 가용성 향상, 입출력 분산

- 단점

: 세심한 관리 요구, 비용 증가, 용량 작은 테이블 파티셔닝 수행 시 성능 저하

● 파티션의 종류 : 범위 분할, 해시 분할, 조합 분할

● 파티션 키 선정 시 고려 사항

- 테이블 접근 유형에 따라 파티셔닝 이루어지도록 선정

- 데이터 관리의 용이성을 위해 이력성 데이터는 파티션 생성 주기와 소멸 주기를 일치시켜야 함

- 매일 생성되는, 백업 기준이 되는 날짜 칼럼, 파티션 간 이동 없는 칼럼, 데이터 분포 양호한 칼럼을 파티션 키로 선정

● 인덱스 파티션

- 파티션 된 테이블의 종속 여부에 따른 구분

Local Partitioned Index : 1:1 대응되도록 파티셔닝, Global Partitioned Index보다 데이터 관리 쉬움

Global Partitioned Index : 독립적으로 구성되도록 파티셔닝

- 인덱스 파티션 키 칼럼의 위치에 따른 구분

Prefixed Partitioned Index : 인덱스 파티션 키와 인덱스 첫 번째 칼럼이 같음

Non-Prefixed Partitioned Index : 인덱스 파티션 키와 인덱스 첫 번째 칼럼이 다름

8. 데이터베이스 용량 설계

: 저장 공간 정의, 저장 공간 예측하여 반영, 물리 DB 설계 과정에서 수행

● 목적 : 저장 공간 효과적 사용, 확장성 및 가용성 높임, 병목 현상 최소화, 접근성 향상, 익스텐트 발생 최소화로 성능 향상

● 접근성 향상 방법 : 테이블의 테이블 스페이스와 인덱스의 테이블 스페이스 분리하여 구성

- 테이블 스페이스와 임시 테이블 스페이스 분리하여 구성

- 테이블을 마스터 테이블과 트랜잭션 테이블로 분류

● 절차 :용량 분석 -> 오브젝트별 용량 산정 -> 테이블과 인덱스 테이블 스페이스 용량 산정 -> 시스템 용량 합해 디스크 용량 산정

9. 분산 데이터베이스 설계

: 처리나 이용 많은 지역에 DB 위치 시킴

● 분산 데이터베이스 구성 요소

- 분산 처리기 : 자체적으로 처리 능려 가지며, 지리적으로 분산되어 있는 컴퓨터 시스템

- 분산 DB : 지리적으로 분산되어 있는 DB

- 통신 네트워크 : 분산 처리기들을 하나의 통신망으로 연결하여 논리적으로 하나의 시스템처럼 작동

● 분산 데이터베이스 설계 시 고려 사항

- 작업 부하의 노드별 분산 정책

- 지역의 자치성 보장 정책

- 데이터의 일관성 정책

- 사이트나 회선의 고장으로부터의 회복 기능

- 통신 네트워크를 통한 원격 접근 기능

● 분산 데이터베이스의 목표

- 위치 투명성(Location Transparency) : 접근하려는 DB의 실제 위치 알 필요 없이 논리적인 명칭만으로 접근, 독립적

- 중복 투명성(Replication Transparency) : 여러 곳 중복되어도 사용자는 하나의 데이터만 존재하는 것처럼 사용 가능

- 병행 투명성(Concurrency Transparency) : 분산 DB와 관련된 다수의 트랜잭션들이 동시에 실현돼도 그 트랜잭션 결과는 영향 X

- 장애 투명성(Failure Transparency) : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 트랜잭션 정확하게 처리

● 분산 데이터베이스 단점

: 기능 복잡, 설계 어렵, 개발 및 처리 비용 증가, 잠재적 오류 증가, 속도 저하

● 분산 데이터베이스 설계(테이블 위치 분산, 분할, 할당)

- 애플리케이션이나 사용자가 분산되어 저장된 데이터에 접근하는 것이 목적

- 전역 관계망을 논리적 측면에서 소규모 단위로 분할, 분할된 결과를 복수의 노드에 할당

● 테이블 위치 분산

- DB의 테이블을 각기 다른 서버에 분산시켜 배치

- 테이블 구조 변경 X, 중복 X 하게 배치, DB 테이블을 각 다른 위치에 배치하려면 테이블 놓일 서버들 미리 설정

● 분할 : 테이블의 데이터를 분할하여 분산

- 분할 규칙 : 완전성, 재구성, 상호 중첩 배제

- 분할 방법 : 수평 분할 = 행 단위 / 수직 분할 : 속성(칼럼, 열) 단위

● 할당 : 동일한 분할을 여러 개의 서버에 생성하는 분산 방법

- 비중복 할당 방식 : 최적의 노드를 선택하여 분산 DB의 단일 노드에서만 분할이 존재, 비용 증가, 성능 저하

- 중복 할당 방식 : 동일 테이블 다른 서버로 복제하는 방식

10. 데이터베이스 이중화 / 서버 클러스터링(개념과 특징)

● DB 이중화 : 시스템 오류로 서비스 중단이나 물리적 손상 시 이를 복구하기 위해 동일 DB를 복제하여 관리하는 것

- 하나 이상의 DB가 항상 같은 상태 유지, DB 문제 생기면 즉시 해결 가능

- 작업 수행 시 이중화 시스템 연결된 다른 DB도 동일 적용

- 분산 시켜 처리해 DB 부하 감소, 손쉽게 백업 서버 운영 가능

● DB 이중화의 분류 : 내용 전달 방식에 따라 분류

- Eager : 트랜잭션 수행 중 데이터 변경 발생 시 이중화된 모든 DB에 즉시 전달하여 변경 내용 즉시 적용

- Lazy : 트랜잭션 수행이 종료되면 변경 사실을 새로운 트랜잭션에 작성하여 각 데이터베이스에 전달하여 데이터베이스마다 새로운 트랜잭션이 수행되는 것으로 간주

● DB 이중화 구성 방법

- 활동 - 대기 방법 : 한 DB 서비스 시 다른 DB 대기, 활성 DB 장애 시 대기 DB가 모든 서비스 대신 수행

구성 방법 및 관리 쉬워 많은 기업에서 사용

- 활동 - 활동 방법 : 두 개의 DB가 서로 다른 서비스 제공, 한쪽 DB 장애 시 다른 한쪽 DB 서비스 제공

두 DB가 모두 처리를 해 처리율 높지만 구성 방법 및 설정이 복잡

● 클러스터링 : 두 대 이상의 서버를 하나의 서버처럼 운영하는 기술

- 서버 이중화 및 공유 스토리지를 사용하여 서버의 고가용성을 제공

- 고가용성 클러스터링 : 하나의 서버 장애 시 다른 서버가 받아서 처리하여 서비스 중단 방지하는 방식, 일반적 언급되는 클러스터링

- 병렬처리 클러스터링 : 전체 처리율 높이기 위해 하나의 작업을 여러 개의 서버에서 분산하여 처리

11. 데이터베이스 보안 / 암호화

● 데이터베이스 보안의 개요 : DB의 일부분 or 전체에 권한이 없는 사용자가 액세스하는 것을 금지하기 위해 사용 기술

- 보안 위한 데이터 단위 다양, DB 사용자들은 일반적으로 서로 다른 객체에 대해 다른 접근 권리, 권한을 가짐

● 암호화 : 평문으로 암호문으로 변환 과정

- 암호화 과정 : 암호화되지 않은 평문을 정보 보호를 위해 암호문으로 바꾸는 과정

- 복호화 과정 : 암호문을 원래의 평문으로 바꾸는 과정

● 개인키 암호 방식 = 비밀키 암호 방식

: 동일한 키로 데이터 암호화 및 복호화, 대칭 암호 방식, 단일키 암호화 기법, 비밀키는 권한 있는 사용자만 가짐

- DES, 전위, 대체, 대수, 합성 기법

● 공개키 암호 방식 = 공중키 암호 방식 : 서로 다른 키로 데이터 암호화 및 복호화

: 암호화 시 사용 = 공개키는 사용자에게 공개, 복호화 시 사용 = 비밀키는 관리자가 비밀리에 관리

- 비대칭 암호 방식, RSA

12. 데이터베이스 보안

● 접근통제 : 데이터가 저장된 객체와 이를 사용하려는 주체 사이의 정보 흐름을 제한

- 비인가된 사용자 접근 감시, 접근 요구자의 사용자 식별, 접근 요구의 정당성 확인 및 기록, 접근의 승인 및 거부

- 임의 접근통제(DAC) : 사용자 신원에 따라 접근 권한 부여, 통제 권한이 주체에 있어 접근 통제 권한 주체가 지정하고 제어, 객체 생성 사용자가 객체 모든 권한 부여받고 다른 사용자에게 허가, SQL 명령어로는 GRANT, REVOKE

- 강제 접근통제(MAC) : 주체와 객체의 등급 비교하여 권한 부여, 제3자가 접근통제 권한 지정,

객체별로 보안 등급 부여 가능, 사용자별로 인가 등급 부여 가능, 주체 보안 등급 자신보다 높으면 모두 불가

동등 시 읽기, 수정, 등록 모두 가능, 낮으면 읽기만 가능

- 접근통제 3요소(접근통제 정책, 접근통제 메커니즘, 접근통제 보안 모델)

● 접근통제 정책 : 어떤 주체가 언제 어디서 어떤 객체에게 어떤 행위에 대한 허용 여부 정의

- 신분 기반 정책 : 주체나 그룹의 신분에 근거하여 객체의 접근을 제한, IBP : 최소 권한 정책, 단일 주체에 하나 객체 허가 부여

GBP : 복수 주체에 대한 허가를 부여

- 규칙 기반 정책 : 주체가 갖는 권한에 근거하여 객체의 접근을 제한, MLP : 사용자 및 객체별로 지정된 기밀 분류에 따른 정책

CBP : 집단별로 지정된 기밀 허가에 따른 정책

- 역할 기반 정책 : 주체의 신분이 아니라 주체가 맡은 역할에 근거하여 객체의 접근을 제한

● 접근통제 메커니즘 : 정의된 접근통제 구현하는 기술적인 방법

- 접근통제 목록 : 객체를 기준으로 특정 객체에 대해 어떤 주체가 어떤 행위를 할 수 있는지를 기록한 문서

- 능력 리스트 : 주체를 기준으로 주체에게 허가된 자원 및 권한을 기록한 목록

- 보안 등급 : 주체나 객체에 부여된 보안 속성의 집합

- 패스워드 : 주체가 자신임을 증명할 때 사용하는 인증 방법

- 암호화

● 접근통제 보안 모델 : 보안 정책 구현 위해 정형화된 모델

- 기밀성 모델 : 군사적인 목적으로 개발된 최초의 수학적 모델로 기밀성 보장이 최우선, 인가된 사용자만 접근 가능

- 무결성 모델 : 기밀성 모델에서 발생하는 불법적인 정보 변경을 방지하기 위해 무결성 기반으로 개발된 모델

일관성 유지에 중점 두어 개발, 인가된 사용자만 수정 가능

- 접근통제 모델 : 접근통제 메커니즘을 보안 모델로 발전시킨 것, 대표적으로 접근통제 행렬

* 접근통제 행렬 : 임의적인 접근통제 관리하기 위한 보안 모델, 행은 주체, 열은 객체

● 접근통제 조건 : 접근통제 메커니즘의 취약점 보완하기 위해 접근통제 정책에 부가하여 적용할 수 있는 조건

- 값 종속 통제 : 객체에 저장된 값에 따라 다르게 접근통제 허용해야 하는 경우

- 다중 사용자 통제 : 지정된 객체에 다수의 사용자가 동시에 접근을 요구하는 경우

- 콘텍스트 기반 통제 : 특정 시간, 넽웤 주소, 접근 경로, 인증 경로 등에 근거하여 접근을 제어하는 방식

● 감사 추적 : 사용자나 애플리케이션이 DB에 접근하여 수행한 모든 활동을 기록하는 기능

- 오류가 발생한 DB를 복구, 부적절한 데이터 조작 파악하기 위해 사용

13. 스토리지

: 대용량의 데이터 저장하기 위해 서버와 저장 장치를 연결하는 기술

- DAS, NAS, SAN

● DAS(Diret Attached Storage)

: 서버와 저장 장치를 전용 케이블로 직접 연결하는 방식, 일반 가정에서 컴퓨터에 외장하드 연결이 여기에 해당

- 서버에서 저장 장치 관리, 직접 연결하므로 속도 빠르고 설치 및 운영 쉬움, 비용 저렴, 다른 서버 접근 X, 공유 X

- 확장성 및 유연성 상대적 떨어짐, 공유 필요 없는 환경에 적합

● NAS(Network Attached Storage)

: 서버와 저장 장치를 네트워크를 통해 연결

- 별도의 파일 관리 기능이 있는 NAS storage가 내장된 저장 장치 직접 관리

- 이더넷 스위치 통해 다른 서버 접근 가능으로 파일 공유 가능, 장소 구애받지 않고 저장 장치에 쉽게 접근

- DAS에 비해 확장성 및 유연성이 우수, 접속 증가 시 성능 저하 우려

● SAN(Storage Area Network)

: DAS의 빠른 처리와 NAS의 파일 공유 장점 혼합 방식, 서버와 저장 장치를 연결하는 전용 넽웤 별도로 구성하는 방식

- 파이버 채널(FC) 스위치를 이용하여 넽웤 구성, 파이버 채널 스위치는 광케이블로 연결하므로 속도 빠름

- 파일 공유 가능, 확장성 유연성 가용성 뛰어남, 높은 트랜잭션 처리에 효과적, 초기 설치 비용 많이 듦

14. 논리 데이터 모델의 물리 테이더 모델 변환

● 테이블 : 데이터를 저장하는 DB의 가장 기본적인 오브젝트

● 엔티티를 테이블로 변환

- 논리 데이터 모델에서 정의된 엔티티를 물리 데이터 모델의 테이블로 변환하는 것

- 테이블과 엔티티 명칭은 동일하게 하는 것을 권고

- 엔티티는 주로 한글명을 사용하지만 테이블은 소스코드 가독성을 위해 영문명을 사용

- 표준화된 용어 사용

● 슈퍼타입 / 서브타입을 테이블로 변환

- 슈퍼타입과 서브타입은 논리 데이터 모델에서 이용되는 형태이므로 물리 데이터 모델 설계 시 테이블로 변환해야 함

- 슈퍼타입 기준 테이블 변환 : 서브타입을 슈퍼타입에 통합하여 하나의 테이블로 만듦, 서브타입 속성이나 관계 적을 시 적용

* 장점 : 데이터 액세스 상대적 용이, 뷰 이용하여 각각의 서브타입만을 액세스하거나 수정 가능, SQL 문장 구성 단순해짐

서브타입 구분 없는 임의 집합에 대한 처리 용이, 수행 속도 빨라짐

*단점 : 디스크 저장 공간 증가, 서브타입에 대한 구분이 필요한 경우 많아짐, 인덱스 효율 떨어짐

- 서브타입 기준 테이블 변환 : 슈퍼타입 속성들을 각각의 서브타입에 추가하여 서브타입들을 개별적인 테이블로 만드는 것, 서브타입에 속성이나 관계가 많이 포함된 경우 적용

* 장점 : 선택 사양 명확한 경우 유리, 처리할 때마다 서브타입 유형 구분할 필요 X, 통합으로 테이블당 크기 감소로 전체 테이블 스캔 시 유리

* 단점 : 수행 속도 감소, SQL 통합 어렵, 부분 범위에 대한 처리 곤란, 여러 테이블 통합한 뷰는 조회만 가능, 식별자 유지 관리 어렵

- 개별타입 기준 테이블 변환 : 슈퍼타입과 서브타입들을 각각의 개별적인 테이블로 변환하는 것이다

슈퍼타입과 서브타입 테이블들 사이는 각각 1:1 관계 성립

* 개별타입 적용하는 경우 : 처리 빈번한 경우, 서브타입 처리 대부분 독립적인 경우, 통합하는 테이블의 칼럼 수 많은 경우, 서브타입의 칼럼 수가 많은 경우, 트랜잭션이 주로 슈퍼타입에서 발생하는 경우, 단일 테이블 클러스터링이 필요한 경우

* 장점 : 저장 공간 상대적으로 작음, 슈퍼타입 서브타입 각각 테이블에 속한 정보만 조회할 경우 문장 작성 용이

* 단점 : 슈퍼타입 or 서브타입의 정보를 같이 처리하면 항상 조인이 발생하여 성능이 저하됨

● 속성을 칼럼으로 변환

- 논리 데이터 모델에서 정의한 속성을 물리 데이터 모델의 칼럼으로 변환

- 일반 속성 변환 : 칼럼의 명칭은 표준화된 약어 사용하여 일치시키는 것이 좋음, 칼럼명은 SQL 예약어 사용 피함

칼럼명은 가능한 한 짧게 지정, 복합 단어를 칼럼명으로 사용 시 미리 정의된 표준 따름, 테이블의 칼럼을 정의한 후 칼럼 정합성 검증

● 관계를 외래키로 변환

- 논리 데이터 모델에서 정의된 관계는 기본키와 이를 참조하는 외래키로 변환

- 1:1 관계(테이블을 모두 독립적인 테이블로 변환 시), 1:N 관계, N:M 관계

● 관리 목적의 테이블/칼럼 추가

- 논리 데이터 모델에는 존재하지 않는 테이블이나 칼럼을 DB 관리 혹은 이용하는 프로그래밍의 수행 속도를 향상시키기 위해 물리 데이터 모델에 추가할 수 있음

● 데이터 타입 선택

- 정의된 논리적인 데이터 타입을 물리적인 DBMS의 물리적 특성과 성능을 고려하여 최적의 데이터 타입과 데이터의 최대 길이를 선택

- Oracle에서 자주 사용되는 데이터 유형 : CHAR = 고정길이 문자열, VARCHAR2 = 가변길이 문자열, NUMBER =38자리 숫자

DATE = 날짜 저장

15. 물리 데이터 모델 품질 검토

- 물리 데이터 모델 설계하고 데이터베이스 객체를 생성한 후 개발 단계로 넘어가기 전에 모델러와 이해관계자들이 모여 수행

- 목적 : 성능 향상과 오류 예방

● 물리 데이터 모델 품질 기준 : 정확성(정확히 표현), 완전성, 준거성(정확히 준수), 최신성, 일관성, 활용성

● 물리 데이터 모델 품질 검토 순서

① 데이터 품질 정책 및 기준 확인

② 물리 데이터 품질의 특성에 따라 품질 기준을 작성

③ 데이터 품질 기준에 따라 체크리스트를 작성

④ 논리 데이터 모델과 물리 데이터 모델을 비교

⑤ 각 모델링 단계의 모델러와 이해관계자가 품질 검토를 수행

⑥ 모델러와 이해관계자가 작성한 체크리스트 내용을 종합하여 물리 DB 모델의 품질 검토 보고서를 작성