공공 데이터 시험 요약

- 1일 -

1. 공공데이터는 공공기관이 직접 생성해서 관리하는 데이터만 해당한다.

정답 : X

취득하여 관리하는 데이터도 포함된다.

2. 공익목적으로 사용할 수 있는 데이터는 공공데이터가 유일하다.

정답 : X

민간데이터도 공익목적으로 사용가능하며, 공익목적의 활용을 염두에 둔 데이터는 민간 공공 구분없이 공익데이터라고 불리고 있다.

1. 가트너는 2012년, 데이터는 21세기의 원유라고 정의한 바 있다.

정답 : O

데이터 가공, 정제는 마치 원유를 정유하듯이 가치를 더해가며, 4차 산업혁명의 신자본으로 불리기도 한다.

2. 우리나라는 지금도 공공데이터 개방 수준이 후진국 수준으로 매우 뒤쳐져 있다는 평가를 받고 있다.

정답 : X

뒤늦게 제도화되고, 관련 정책의 시작이 빠른 편은 아니었지만, OECD 평가에서 3회 연속 세계 1위로 평가되는 등 매우 빠르게 진행되어 이제는 세계를 선도하는 수준에 이르게 되었다.

3. 우리나라에서 공공데이터의 제공 및 이용 활성화에 관한 법률 (약칭: 공공데이터법)을 제정한 것은, 세계에서 유래가 없는 매우 빠른 시기에 이루어진 성과이다.

정답 : X

우리나라에서 공공데이터의 제공 및 이용 활성화에 관한 법률 (약칭: 공공데이터법)은 2013년 제정되었으며, 이는 EU의 PSI Reuse Directive 를 모델로 법률안을 연구하기 시작하여 상대적으로 늦게 제도화된 것이다.

4. 소위 데이터3법 개정으로 가명정보 개념이 신설되었다. 이에 따라 공공기관은 개인정보를 가명화하여 제공할 의무가 생겼다.

정답 : X

제26조(공공데이터의 제공) ③ 공공기관의 장은 이용자의 요청에 따라 추가적으로 공공데이터를 생성하거나 변형 또는 가공, 요약, 발췌하여 제공할 의무를 지지 아니한다. #가명정보 역시 개인정보이므로, 공공데이터법에 따른 제공 대상은 아니다.

5. 우리나라에서 데이터를 활용하여 성과를 거둔 대표적 사례가 아닌 것은?

정답 : 88 서울올림픽 유치

KT 기지국 통계 및 축산차량 이동 데이터, 버스 도착 데이터 등을 활용한 사례들이다.

1. 개인에 관한 정보는 반드시 특정 1인만의 정보이어야 한다.

정답 : X

그렇지 않습니다. 예를 들어, SNS에 단체 사진을 올린다면 사진의 영상정보는 사진에 있는 인물 모두 각자의 개인정보에 해당합니다.

2. 정보주체의 동의를 받은 경우에는 예외적으로 주민등록번호를 처리할 수 있다.

정답 : X

민감정보 및 고유식별정보는 원칙적으로 처리가 금지되지만, 정보주체에게 별도의 동의를 받거나 법령에서 처리를 요구 또는 허용하는 경우에 한하여 처리할 수 있습니다. 그러나, 주민등록번호는 정보주체의 동의를 받아도 원칙적으로 처리가 불가능합니다.

3. 개인정보 처리자는 통계목적, 과학적 연구, 공익적 기록보존 등을 위하여 정보주체의 동의 없이 가명정보를 처리할 수 있다.

정답 : O

2020년 개정된 개인정보 보호법에서는, 개인정보처리자가 통계목적, 과학적 연구, 공익적 기록보전 등을 위하여 정보주체의 동이 없이도 가명정보를 처리할 수 있도록 규정하고 있습니다.

4. 개인정보처리자는 보유기간의 경과, 개인정보의 처리목적 달성 등 그 개인정보가 불필요하게 되었을 때, 지체없이 그 개인정보를 파기해야 한다.

정답 : O

개인정보처리자는 보유기간의 경과, 개인정보의 처리목적 달성 등 그 개인정보가 불필요하게 되었을 때, 지체없이 그 개인정보를 파기해야 합니다. 이를 위반시 3천만원 이하의 과태료에 처하게 됩니다.

5. 개인정보의 주체는 자연인이어야 한다. 따라서 법인 또는 단체에 관한 정보는 개인정보에 해당하지 않는다. 그러므로 업무 당담자의 이름이나 개인연락처 등 역시 개인정보에 해당하지 않는다.

정답 : X

법인 또는 단체의 관한 정보이면서 동시에 개인에 관한 정보인 대표자를 포함한 인원진과 업무담당자의 이름, 주민등록번호, 자택주소 및 개인 연락처, 사진 등 그 자체로 개인을 식별할 수 있는 정보는 개별 상황에 따라 법인 등의 정보에 그치지 않고 개인정보로 취급될 수 있습니다.

6. 개인정보처리자는 가명정보를 처리하는 과정에서 특정 개인을 알아볼 수 있는 정보가 생성된 경우에는 즉시 해당 정보의 처리를 중지하고, 지체없이 회수 및 파기하여야 한다.

정답 : O

맞는 설명이다.

- 2일 -

1. 컴퓨터에서 2진수 1개를 저장하는 가장 기본 단위로, 0 또는 1을 저장할 수 있는 가장 간단한 메모리 구조를 비트(bit)라고 한다.

정답 : O

맞는 설명이다.

2. 컴퓨터에서 8자리 2진수 1개를 저장하기 위해서, 비트 8개를 묶은 것을 워드(word)라고 하고, 1개의 워드에는 보통 2개의 문자를 저장할 수 있다.

정답 : X

비트 8개를 묶은 것을 바이트(byte)라고 하며, 보통 문자 1개를 저장할 수 있다.

3. 컴퓨터 시스템을 구성하는 4대 요소가 아닌 것은?

정답 : 매뉴얼

컴퓨터 시스템의 4대 구성요소는 하드웨어, 소프트웨어, 데이터, 사용자 이다.

4. 데이터베이스에 저장된 데이터의 논리 구조 사양은 일종의 설계도 형태이고, 이것을 데이터베이스 스키마 (schema)라고 한다.

정답 : O

데이터베이스 스키마는 데이터베이스의 설계도 역할을 하며, 저장된 데이터의 논리 구조 사양이다.

5. 데이터베이스에서 데이터를 검색하도록 요청하는 것을 데이터베이스 쿼리 (query)라고 한다.

정답 : O

데이터베이스 쿼리는 일종의 질문 방법으로, 데이터를 검색하도록 요청하는 것이다.

6. 웹 브라우저에서 보내달라고 요청한 웹페이지를 보내주는 컴퓨터를 "HTML"이라고 한다.

정답 : X

웹 브라우저에서 보내달라고 요청한 웹페이지를 보내주는 컴퓨터는 "웹서버"라고 한다.

1. 데이터 문제의 정의 시에 필수 고려 사항이 아닌 것은?

정답 : 문제 해결 시의 경제적 이득은 얼마인가?

데이터 문제의 정의 시에는 1,2,3의 조건과 "문제 해결에 필요한 시간/비용은 얼마인가"를 필수적으로 고려해야 한다.

2. 데이터 수집 계획서의 설명으로 맞지 않는 것은?

정답 : 데이터의 수집 목적에 부합되는 세부항목이 누락된 경우에도 원천 데이터로 확보하여야 한다.

데이터의 선정시에, "수집 목적에 부합하는 세부항목이 정확히 존재하는가"를 고려하여야 함.

3. 데이터 품질에서 잡음(noise, 노이즈)는 측정 과정에서 의도적으로 삽입된 오류값을 의미한다.

정답 : X

잡음은 측정과정에서 무작위로 발생한 측정값 에러를 의미한다.

4. 센서의 일시적 고장으로 자료 입력이 일부 누락된 경우는 결측치(missing value)에 해당한다.

정답 : O

결측치는 자료 입력이 누락되거나, 고의로 빠진 경우를 의미하며, 센서의 일시적 고장, 설문 조사의 특정항목 거부 등으로 발생한다.

1. 데이터 파이프라인 중, ETL 파이프 라인은 클라우드 환경에 적합하고, ELT 파이프 라인은 비교적 저용량 데이터 수집에 적합하다.

정답 : X

데이터 파이프라인 중, "ETL 파이프 라인"은 "비교적 저용량 데이터 수집에 적합"하고, "ELT 파이프 라인"은 "클라우드 환경에 적합"하다.

2. SLA (service level agreement)는 실제 사용 가능을 보장하는 시간 비율을 의미한다.

정답 : O

맞는 설명이다.

3. 메타데이터의 종류가 아닌 것은?

정답 : 축소용 메타데이터

메타데이터의 종류로는 기술용 메타데이터, 관리용 메타데이터, 구조용 메타데이터가 있다.

4. SDS (software defined storage)는 스토리지 가상화를 제공하는 기술로, 대부분 외장 하드 형태로 PC/서버 컴퓨터에 직접 연결하는 방식이다.

정답 : X

SDS가 스토리지 가상화를 제공하는 것은 맞으나, 외장 하드 형태로 직접 연결되는 방식은 DAS (direct attached storage)에 대한 설명이다.

1. SEMMA (Sampling Explore Modify Modeling Assessment) 모델은 SAS사가 주도하는 데이터마이닝 방법론이다.

정답 : O

SEMMA (Sampling Explore Modify Modeling Assessment) 모델은 SAS사가 주도하는 기술 중심, 통계 중심 데이터마이닝 방법론이다.

2. 묘사적 데이터 분석 (descriptive data analysis)은 현재의 모습을 요약하여 기술하는 방법이다.

정답 : O

묘사적 데이터 분석 (descriptive data analysis)는 수집된 데이터의 평균, 표준편차, 빈도수, 백분위수 등을 다룬다.

3. 탐색적 데이터 분석 (exploratory data analysis)는 도출된 가설을 검증하고, p-value 기준의 의사결정을 하는 방법이다.

정답 : X

확증적 데이터 분석 (confirmatory data analysis)는 도출된 가설을 검증하고, p-value 기준의 의사결정을 하는 방법이다. 수집된 데이터의 평균, 표준편차, 빈도수, 백분위수 등은 묘사적 데이터 분석에서 다룬다. 탐색적 데이터 분석은 수집된 데이터의 증상 탐색을 통한 가설 도출 방법이다.

4. 확증적 데이터 분석 (confirmatory data analysis)는 수집된 데이터의 평균, 표준편차, 빈도수, 백분위수 등을 표현하는 분석방법이다.

정답 : X

확증적 데이터 분석 (confirmatory data analysis)는 도출된 가설을 검증하고, p-value 기준의 의사결정을 하는 방법이다. 수집된 데이터의 평균, 표준편차, 빈도수, 백분위수 등은 묘사적 데이터 분석에서 다룬다.

5. 예측 데이터 분석 (predictive data analysis)는 관계식을 만들고, 최족 조건을 예측하는 방식으로, y=f(x) 함수식 모델을 도출한다.

정답 : O

맞는 설명이다.

6. 데이터 분석의 적용 모델이 아닌 것은?

정답 : 일괄 수행 방식

데이터 분석 모델에는 폭포수, 프로토타입, 나선형 등이 있다. 일괄수행 방식은 컴퓨터 프로그램 수행 방식 중의 하나이다.

7. 통계 분석의 관점에서는 데이터의 유형을 시간에 따라, 횡단형 (cross-sectinoal)과 종단형 (longitudinal)로 구분할 수 있다.

정답 : O

맞는 설명이다.

1. 부호-크기 (signed-magnitude) 방식으로 정수를 표현할 때는 0에 대해서 2가지 표현이 가능하다.

정답 : O

부호-크기 방식에서는 +0과 -0의 2가지 표현이 가능하다.

2. SVG는 벡터 그래픽스 (vector graphics) 파일 포맷이다.

정답 : O

SVG는 scalable vector graphics 의 약자로, vector graphics 파일 포맷 중의 하나이다.

3. 현재의 유니코드 (Unicode) 문자 체계에서는 현대 한글을 표현하기 위해 자음 14자, 모음 10자만을 할당하고 있다.

정답 : X

현대 한글 표현에는 초성 19자, 중성 21자, 종성 28자의 모든 조합으로, 총 11,172자를 할당하고 있다.

4. "보수" (complement, 10의 보수, 2의 보수 등)는 컴퓨터에서 음수를 표현하는 방법 중의 하나이다.

정답 : O

컴퓨터에서는 2의 보수 (2's complement)를 사용하여 음수를 표현하고 있다.

5. 실수를 표현하는 방법 중에서, 고정 소수점 방식은 작은 범위의 숫자는 물론, 매우 큰 숫자를 표현하기에도 적합하다.

정답 : X

고정소수점 방식은 작은 범위의 수 표현에는 무난하나, 큰 숫자는 표현하거나, 처리하기가 불가능하다.

6. 이미지를 저장하는 파일 포맷이 아닌 것은?

정답 : FLAC

FLAC (free lossless audio codec) 은 오디오 자료를 저장하는 파일 포맷이며, BMP (bitmap), PNG (portable network graphics), jpeg (joint photographic expert group)은 모두 이미지를 저장하는 파일 포맷이다.

7. 현재의 16비트 유니코드 문자체계에서 일반적으로 표현하기 곤란한 것은?

정답 : 고대 한글에서 사용하는 한글 조합 1,638,750자

고대 한글에서 사용하는 모든 조합 1,638,750자는 16비트 코드로는 표현이 불가능하여, 32비트 코드 체계가 필요하다.

- 3일 -

없음

- 4/5/6/7일 -

1. 데이터가 변경되었으나 수식의 결과가 바뀌지 않을 때 확인 방법이 아닌 것은?

정답 : F10 키를 눌러 수동 계산 모드를 확인한다.

F10키는 계산 모드를 확인하는 키가 아닙니다

2. 데이터가 입력될 때 한글이 영문으로 자동 변경되는 것을 막고자 할 때 변경하는 엑셀 옵션은?

정답 : 한/영 자동 고침 체크 해제

한/영 자동 고침 옵션의 체크를 해제해야 합니다.

3. 리본 메뉴의 기능을 빠른 실행 도구 모음에 추가하는 방법은?

정답 : 해당 기능을 우측 클릭해서 빠른 실행 도구 모음에 추가를 클릭한다.

기능을 우측 클릭하고 빠른 실행 도구 모음에 추가를 실행하면 추가됩니다.

1. 다음 중 Shift 키로 할 수 있는 내용이 아닌 것은?

정답 : 데이터나 함수의 일괄 입력

데이터나 함수의 일괄 입력은 Ctrl 키를 이용합니다.

2. 다음 중 Alt 키를 이용해서 할 수 있는 내용은?

정답 : 셀 크기에 맞게 사진 삽입하기

Alt 키를 이용하면 셀 크기에 맞춰 사진을 삽입할 수 있습니다.

3. 다음 연산자 중 산술 연산자가 아닌 것은?

정답 : &

&는 텍스트 연결 연산자 입니다.

1. 다음 중 엑셀 데이터 참조의 종류가 아닌 것은?

정답 : 순환참조

순환참조는 데이터 참조 중 오류의 한 형태입니다.

2. 엑셀 데이터 참조 중 절대참조의 특징은?

정답 : 수식을 복사해도 참조셀 주소가 변경되지 않는다.

절대 참조라면 수식을 복사해도 이동거리 만큼 참조셀 주소가 변경되지 않습니다.

3. 엑셀 데이터 참조를 익혀야 하는 이유는?

정답 : 한 번 수식 입력 후 복사해서 빠르게 결과를 만들 수 있다.

한 번 입력 후 복사만으로 결과를 빠르게 만들어 낼 수 있습니다.

1. 다음 중 엑셀 시트에 입력된 데이터 중 숫자 속성 데이터는?

정답 : 43286

날짜는 숫자 속성입니다.

2. 사용자 지정 셀 서식의 예약어 중 연도를 나타내는 예약어는?

정답 : y

년도를 나타내는 예약어는 'y'입니다.

3. 다음 중 사용자 지정 셀 서식의 올바른 데이터 표현 순서는?

정답 : 양수;음수;0;문자열

사용자 지정 셀 서식의 데이터 표현 순서는 양수;음수;0;문자열 순서입니다.

1. 엑셀 빅데이터를 효율적으로 처리하기 위한 사전 기능으로 동적 범위를 지원하는 기능은?

정답 : 표

데이터를 표로 지정하면 동적 범위를 지원하므로 빅데이터를 효율적으로 관리, 활용할 수 있습니다.

2. 다음 중 표 기능의 설명 중 틀린 것은?

정답 : 데이터 유효성 검사와 같이 사용할 수 없다.

데이터 유효성 검사와 같이 사용하면 거래처 등을 손쉽게 관리할 수 있습니다.

3. 차트 작성 시 데이터를 미리 표로 만드는 이유는?

정답 : 추가된 데이터를 추가 작업 없이 차트에 반영하기 위해

새롭게 추가된 데이터를 차트에 자동 반영해 주기 위해 동적범위를 지원하는 표로 지정합니다.

1. 피벗 테이블을 작성하며 분석 결과 중 세로로 나열하고자 하는 필드를 배치하는 곳은?

정답 : 행

행에 필드를 배치하면 고유 목록이 세로로 나열되게 됩니다.

2. 다음 중 피벗 테이블의 분석 결과를 빠르게 다양한 조합으로 만드는 기능은?

정답 : 슬라이서

슬라이서를 이용하면 다양한 조합과 빠른 분석 결과를 나타낼 수 있습니다.

3. 피벗 테이블에 슬라이서 삽입 시 가로형 슬라이서의 항목 수를 조정하는 방법은?

정답 : 옵션 - 단추 - 열 크기 조정

슬라이서의 열 크기를 조정하면 항목 수를 조정할 수 있습니다.

1. 다음 중 스파크라인으로 표현할 수 있는 내용이 아닌 것은?

정답 : 방사형 차트 효과

방사형 차트 효과는 스파크라인으로 작성할 수 없습니다.

2. 다음 스파크라인 종류 중 양수, 음수와 같이 둘 중 하나를 다른 색으로 표현하는 스파크라인은?

정답 : 승패

둘 중 하나를 별도색으로 표현하는 스파크라인은 승패입니다.

3. 다음 중 임의의 스파크라인 1개를 삭제하는 방법은?

정답 : 스파크라인 선택 후 우측 클릭 - 스파크라인 - 선택한 스파크라인 지우기

1개만 삭제할 때는 우측 클릭 후 스파크라인 - 선택한 스파크라인 지우기를 실행합니다.

1. 다음 중 조건이 1개(단일 조건)일 때 합계를 나타내는 함수는?

정답 : SUMIF

단일 조건의 합계는 SUMIF 함수를 이용합니다.

2. 다음 함수의 설명으로 맞는 것은?
'=COUNTIF(A1:A10,"홍길동")

정답 : A1:A10 셀 범위에서 '홍길동'이란 데이터가 몇 개 들어 있는지를 나타낸다.

COUNTIF 함수는 개수를 나타내는 함수로 위 함수는 A1:A10 셀 범위에서 '홍길동'이란 데이터가 몇 개 들어 있는지를 나타냅니다.

3. 이미 정의된 이름 정의를 함수에서 가져와 사용할 때 사용하는 키는?

정답 : F3

F3키를 이용하면 이미 입력된 이름 정의를 불러와 사용할 수 있습니다.

1. 찾는 값이 세로로 나열되어 있고 나타낼 값은 그보다 우측에 있을 때 사용하는 함수는?

정답 : VLOOKUP

VLOOKUP 함수를 이용하면 기준열에서 우측의 값을 손쉽게 나타낼 수 있습니다.

2. VLOOKUP 수식의 네 번째 인수가 참(TRUE)로 입력되었다면 해석은?

정답 : 두 번째 인수의 기준열에서 찾고자 하는 값보다 작거나 같은 값 중 최댓값을 찾는다.

네 번째 인수가 참(TRUE)라면 기준열에서 찾고자 하는 값보다 작거나 같은 값 중 최댓값을 찾습니다.

3. 반올림 관련 수식 중 5 이상의 값이 나타나도 절사하는 함수는?

정답 : ROUNDDOWN

절사 수식은 ROUNDDOWN입니다.

1. 논리곱(AND)의 조건 데이터를 필터하는 기능은?

정답 : 자동 필터

자동 필터는 논리곱 조건의 데이터를 필터할 때 일반적으로 사용됩니다.

2. 다음 자동 필터의 기능 설명 중 틀린 것은?

정답 : 논리합(OR)의 조건 및 데이터를 필터할 수 있다.

자동 필터는 논리합(OR)의 조건 데이터는 필터할 수 없습니다.

3. 자동 필터 중 첫 번째 글씨가 '이'로 시작하는 데이터만 빠르게 필터하고자 할 때의 방법은?

정답 : 검색란에 '이'라고 입력하면 '이'로 시작하는 데이터만 열거되고 그때 [확인] 버튼을 클릭한다.

검색란에 한 글자만 입력하면 해당 글자로 시작하는 데이터만 나타나게 됩니다.

1. 숫자가 작은 수부터 큰 수로 나열하는 정렬 방법은?

정답 : 오름차순 정렬

작은 수부터 큰 수로 나열하는 정렬은 오름차순 정렬입니다.

2. '데이터를 입력할 셀' 선택 시, 우측에 드롭다운 표시가 나타나고 선택 입력하게 하는 기능은?

정답 : 데이터 유효성 검사

데이터를 선택 입력할 수 있게 만드는 기능은 데이터 유효성 검사입니다.

3. 다음 중 정렬에 대한 설명 중 틀린 것은?

정답 : 정렬 조건이 단일 조건이라도 데이터를 모두 선택, 정렬해야 한다.

정렬 조건이 단일 조건인 경우는 머릿글만 선택하고 정렬할 수 있습니다.

1. 피벗 테이블 작성 시 보고서에 가로로 배치하고자 할 때 필드를 배치시키는 곳은?

정답 : 열

가로 배치 데이터는 열에 필드를 이동시킵니다.

2. 피벗 테이블을 작성하며 데이터가 추가, 삭제, 변경되면 반영시키기 위해 해야 할 일은?

정답 : 새로고침

데이터가 추가, 삭제, 변경되면 반드시 새로 고침해야만 결과가 반영됩니다.

3. 피벗테이블 기능 중 사용자의 조건에 맞는 다양한 조합을 빠르고 쉽게 만드는 기능은?

정답 : 슬라이서

슬라이서를 이용하면 다양한 조합을 빠르게 만들고 분석을 쉽게 할 수 있습니다.

1. 피벗 테이블 작성시 통계량이 나타나는 조건을 지정하는 부분은?

정답 : 필터

통계량이 나타나는 조건은 필터에서 지정합니다.

2. 피벗 테이블에서 비율을 표시하는 방법은?

정답 : 나타내고자 하는 필드 우측 클릭>값 표시 형식

값 표시 형식을 통해 비율을 나타냅니다.

3. 다음 피벗 테이블에 관한 설명 중 틀린 것은?

정답 : ∑값 영역에 사용된 필드는 한 번만 사용 가능하다.

∑값 영역에 사용된 필드는 다중 사용 가능합니다.

1. 다음 중 피벗테이블 설명으로 틀린 것은?

정답 : 데이터를 표로 지정하면 데이터가 추가되어도 자동 반영된다.

표로 지정해도 반드시 피벗 테이블을 새로고침 해야 반영됩니다.

2. 보고서 필터 페이지 표시를 통해 특정 필드의 전체가 아닌 임의의 종류로만 나누고자 할 때의 방법은?

정답 : 필터 영역의 해당 필드에서 나누고자 하는 항목을 선택 후 보고서 필터 페이지 표시를 실행한다.

먼저 나눠질 항목을 선택 후, 보고서 필터 페이지 표시를 실행합니다.

3. 피벗 테이블에서 통계량의 서식을 한 번에 모두 변경하고자 할 때 실행하는 기능은?

정답 : 필드 표시 형식

필드 표시 형식을 실행, 셀 서식에서 지정하면 모든 통계량 전체의 서식을 변경할 수 있습니다.

1. 비정상적인 날짜를 변환할 때 사용하는 기능은?

정답 : 텍스트 나누기

텍스트 나누기 3단계에서 열 데이터 서식을 날짜로 지정하면 됩니다.

2. 다음 중 데이터가 문자인지 숫자인지 데이터 속성을 확인하는 함수는?

정답 : TYPE

TYPE 함수를 이용하면 해당 셀의 데이터 속성을 확인할 수 있습니다.

3. 문자로 입력된 숫자 형식을 정상적인 숫자로 빠르게 일괄 변환하는 방법은?

정답 : 빈 셀에 1을 입력하고 해당 값을 변환하고자 하는 데이터에 값으로 곱하기 한다.

빈 셀에 1을 입력, 복사하고 값으로 곱하기 하면 숫자로 변경됩니다.

1. 찾고자 하는 값들이 첫 번째 열에 세로로 나열되어 있고 나타내고자 하는 값이 그 우측에 있을 때 사용하는 함수는?

정답 : VLOOKUP

기준열에 찾고자 하는 값이, 그 우측에 나타낼 값이 있는경우 VLOOKUP 함수를 이용합니다.

2. VLOOKUP 함수에서 기준열에서 찾고자 하는 값이 없을 때 나타나는 오류는?

정답 : N/A

기준열에서 찾고자 하는 값이 없다면 #N/A 오류를 반환합니다.

3. 함수의 결과가 오류일 때, 오류 대신 다른값으로 변환해서 나타내게 하는 함수는?

정답 : FERROR

IFERROR 수식을 이용하면 오류시 다른 값으로 변경해서 나타낼 수 있습니다.

1. VLOOKUP 함수 사용 시 조건이 2개 이상일 때 특정 값을 불러오는 방법은?

정답 : 파생열을 만들어 조건을 텍스트 연결 연산자로 연결하여 기준열로 사용한다.

파생열을 만들어 조건을 연결, 기준열로 사용하면 가능합니다.

2. 기준 데이터 범위가 2개 이상일 때 VLOOKUP 함수로 특정 값을 나타내는 방법은?

정답 : IF 함수를 이용해서 조건에 맞는 범위를 지정해서 가져온다.

IF 함수를 이용해서 조건에 맞는 범위를 지정, 가져오게 합니다.

3. 다음 중 대표 문자는 어느 것인가?

정답 : *

엑셀 대표문자는 *과 ?입니다.

1. 엑셀 시각화 기능 중 사용자 조건에 따라 서식이 나타나는 기능은?

정답 : 조건부 서식

조건부 서식은 사용자가 지정한 조건에 부합될 때 서식을 변경하는 기능입니다.

2. 다음 중 조건부 서식의 설명 중 틀린 것은?

정답 : 수식을 조건으로 입력할 수 없다.

수식을 조건으로 입력할 수 있습니다.

3. 다중열에 전체 열 범위를 서식을 지정할 때의 방법은?

정답 : 범위 선택 후 기준 셀의 열을 혼합참조로 지정한다.

기준이 되는 셀의 열을 혼합참조로 지정합니다.

1. 고급 필터로 '김덕'이라는 정확한 자료를 필터하고자 할 때의 조건 입력으로 맞는 것은?

정답 : '=김덕

정확한 자료의 필터는 먼저 '(어퍼스트로피)를 입력하고 =아이템, 형태로 입력합니다.

2. 고급 필터로 A로 시작하는 데이터를 필터하고자 할 때의 조건 입력으로 맞는 것은?

정답 : A*

첫 글자가 A이므로 A*로 입력해야 합니다.

3. 고급 필터로 조건에 부합되는 특정 필드 데이터만 필터하는 방법은?

정답 : 필터할 필드명을 복사해 두고 고급 필터를 실행한 뒤 복사할 위치로 지정합니다.

필터할 필드명을 먼저 복사해 두고 복사할 위치로 지정해야 합니다.

1. 다음 중 절사를 하는 수식은?

정답 : ROUNDDOWN

절사 수식은 ROUNDDOWN 입니다.

2. 다음 수식의 결과로 올바른 것은?
'=ROUNDUP(12345,-2)

정답 : 12400

백으로 자리로 절상하는 수식이므로 12400으로 나타납니다.

3. ROUND 수식의 두 번째 인수를 -1로 입력했을 때의 올바른 해석은?

정답 : 첫 번째 인수로 입력된 값을 십의 자리로 반올림한 결과를 나타낸다.

-1이므로 십의 자리로 반올림해서 나타냅니다.

1. 다음 중 지속적인 증감을 표시해 총 누적을 쉽게 표시하는 차트는?

정답 : 폭포 차트

폭포 차트를 이용하면 최종 누적 금액을 쉽게 확인할 수 있습니다.

2. 3D 맵에서 지도의 지명 등이 나타나도록 하는 옵션은?

정답 : 홈 > 지도 > 지도 라벨

지도 라벨을 클릭하면 지도의 라벨(지명)이 나타납니다.

3. 다음 중 계층 구조 안에서 비율을 표시하는데 용이한 차트는?

정답 : 트리맵 차트

트리맵 차트를 이용하면 계층 구조 안에서 비율 표시를 쉽게 할 수 있습니다.

1. 차트의 제목을 임의의 데이터와 연동하는 방법은?

정답 : 제목을 선택하고 수식 입력줄을 클릭한 뒤 '='을 누르고 연동 데이터를 선택 후 ENTER 키를 누른다.

제목을 선택하고 수식 입력줄에서 '='을 누르고 연동 데이터를 선택 후 ENTER 키를 누르면 연동됩니다.

2. 차트의 그라데이션 효과를 나타낼 때 색깔의 각도 기준은 몇시 방향인가

정답 : 9시

각도의 기준은 9시 방향입니다.

3. 차트에서 수치를 표현할 때 실행하는 기능은?

정답 : 데이터 레이블 추가

데이터 레이블 추가를 클릭하면 해당 계열의 레이블이 표시됩니다.

- 8일 -

1. 정보는 기업 경영에 관한 의사 결정에 중요한 역할을 한다.

정답 : O

정보는 의미가 없는 데이터를 처리하여 얻은 의미 있는 값으로써 의사 결정을 할 수 있는 지식이라 할 수 있다.

2. 데이터란 현실세계(real world)로부터 단순한 관찰이나 측정을 통해서 수집된 사실(facts)이나 값(values)을 말한다.

정답 : O

데이터란 현실세계(real world)로부터 단순한 관찰이나 측정을 통해서 수집된 사실(facts)이나 값(values)을 말한다.

1. 데이터베이스에서 관계는 정보를 추출하는데 중요한 역할을 수행하지만 데이터베이스에 저장될 필요는 없다.

정답 : X

데이터베이스에서는 개체뿐만 아니라 관계도 저장되어야 한다.

2. 데이터베이스는 개념적으로 개체(entities)와 속성(attributes)로 구성되어 있다.

정답 : X

데이터베이스는 개념적으로 개체(entities)와 관계(relationships)로 구성되어 있다.

3. 학번, 성명, 전화번호와 같은 속성 이름들로만 기술된 타이틀 레코드를 개체 집합(entity set)이라 한다.

정답 : X

학번, 성명, 전화번호와 같은 속성 이름들로만 기술된 타이틀 레코드를 개체 타입(entity type)이라 한다.

1. 조직 전체의 논리적 구조를 변경시키더라도 기존 응용 프로그램에는 영향을 주지 않는 능력을 물리적 데이터 독립성이라 한다.

정답 : X

본 내용은 물리적 데이터 독립성이 아니라 논리적 데이터 독립성이라 할 수 있다.

2. 전통적인 화일 시스템의 문제점으로는 데이터 종속성과 데이터 중복성이 있을 수 있다.

정답 : O

전통적인 화일 시스템의 문제점으로는 크게 데이터 종속성(data dependency)과 데이터 중복성(data redundancy)으로 명시될 수 있다.

3. 릴레이션 스키마는 하나의 논리적 구조로부터 여러 가지 다양한 물리적 구조를 지원할 수 있는 사상(mapping) 능력이 있어야 가능하다.

정답 : X

논리적 데이터 독립성과 물리적 데이터 독립성은 하나의 논리적 구조로부터 여러 가지 다양한 물리적 구조를 지원할 수 있는 사상(mapping) 능력이 있어야 가능하다.

1. 릴레이션 개념에서 카디널리티란 투플의 수로 정의된다.

정답 : O

릴레이션에서 커디널리티란 투플의 수를 의미하고 차수(degree)는 애트리뷰트의 개수를 의미한다.

2. 후보키가 둘 이상 되는 경우에 그 중에서 어느 하나를 선정하여 기본키라 지정하면 나머지 후보키들은 무엇이라 할 수 있는가?

정답 : 대체키

예를 들어, <학번>과 <성명, 학과>가 후보키가 된다고 했을 때 <학번>을 기본키라 하면 <성명, 학과>는 대체키가 된다.

3. 도메인(domain)이란 하나의 튜플이 취할 수 있는 같은 타입의 모든 원자들의 집합을 말한다.

정답 : X

도메인(domain)이란 하나의 애트리뷰트가 취할 수 있는 같은 타입의 모든 원자들의 집합을 말한다.

- 9일 -

1. 다음 중 가장 작은 단위의 정보는?

정답 : 필드

여러 개의 필드가 하나의 레코드를 이룰 수 있으므로, 필드가 가장 작은 정보 저장 단위이다.

2. 메인 메모리보다 디스크에서 데이터를 가지고 오는 것이 훨씬 빠르다.

정답 : X

디스크가 10,000배 느리다.

3. 다음 중 인덱스의 특성으로 옳지 않은 것은?

정답 : 테이블 데이터보다 훨씬 큰 공간을 차지한다.

일반적으로, 인덱스의 크기는 인덱스를 생성하는데 사용된 원래(원본) 테이블 데이터보다 훨씬 작다.

4. 더 이상 필요하지 않은 인덱스는 삭제하는 것이 좋다.

정답 : O

인덱스도 데이터이므로, 필요하지 않는 경우 삭제하는 것이 저장 공간을 절약하는 데 도움이 된다.

1. SQL 언어의 특성으로 가장 알맞은 것은?

정답 : 선언적인 언어

SQL은 데이터에 대한 명령을 절차적으로 하지 않고 선언적으로 한다.

1. 데이터베이스 테이블 생성 후 이전에 했던 작업이 무효화되지 않도록 저장하는 명령어는 'rollback'이다.

정답 : X

commit는 작업을 무효화되지 않도록 저장하는 명령어이며, commit 이전의 상태로 복구시키는 명령어는 rollback이다.

2. 아래의 질의는 Employee테이블의 Salary 속성값을 추출하여 중복 제거를 수행한다.

SELECT DISTINCT Salary
FROM Employee;

정답 : O

DISTINCT는 중복을 제거하는 키워드이다.

3. 다음의 SQL문은 Employee 테이블 전체를 삭제하지 않는다.

DELETE FROM Employee;

정답 : O

DELETE는 테이블에 있는 튜플을 삭제하는 명령문이므로, 테이블까지 삭제하지는 않는다. 테이블까지 삭제하려면 DROP 명령어를 사용해야 한다.

4. 다음 중 데이터베이스 테이블 변경 후 수행한 작업을 영속적으로 반영하기 위한 명령어는 무엇인가?

정답 : COMMIT

commit 명령문을 (명시적으로)수행해야 갱신/삽입/삭제 등 데이터베이스 변경 작업이 영속적으로 반영된다.

5. 다음 중 데이터 정의어(DDL)로 맞지 않는 것은?

정답 : REVOKE

REVOKE는 데이터 제어어(DCL)의 명령어이다.

6. 제약조건은 SQL 스키마의 구성 요소가 아니다.

정답 : X

SQL 스키마의 구성 요소는 테이블, 제약조건, 뷰, 도메인 등이 있다.

7. 아래의 질의는 부서명이 'Research'가 아닌 부서를 찾는 질의이다.

SELECT *
FROM Department
WHERE Dname IN ('Research');

정답 : X

NOT IN을 사용해야 한다.

8. 아래의 질의는 연봉이 50000불 이하인 직원 중 부서원이 3명 이상인 부서의 부서번호와 평균 연봉을 출력한다.

SELECT Dno, Avg(Salary)
FROM Employee
WHERE Salary <= 50000
GROUP BY Dno
HAVING COUNT(*) > 2;

정답 : O

예시 질의는 맞는 질의이다. 즉, 해당 질의는 Salary가 50000불 이하인 직원을 찾고, Dno(부서번호)가 같은 부서에 속해 있는 직원들로 그룹핑한다. 또한 예시 질의에서는 그렇게 그룹핑한 부서 중 해당 부서에 근무하는 직원이 3명 이상인 부서를 찾기 위해, COUNT(*) > 2를 사용한다. 최종적으로, 예시 질의는 이러한 결과를 통해 선택된 부서의 부서번호(Dno), 그 부서의 직원의 평균 연봉(Avg(Salary))를 SELECT절에서 추출하고 이를 반환한다.

1. 다음과 같이 "5번 부서의 모든 직원보다 더 많은 연봉을 받는 직원을 찾으시오."라는 질의를 작성하려고 한다. 괄호에 들어가야 할 '키워드'를 대체할 연산자로 가장 알맞은 것은?

SELECT Lname, Fname
FROM Employee
WHERE Salary > (키워드) (SELECT Salary FROM Employee
WHERE Dno = 5);

정답 : ALL

ALL은 하위 질의의 '모든' 결과에 대하여 어떤 표현식을 수행할 때 사용하는 키워드이다.

2. SYSDATE는 DBMS 시스템 상의 현재 날짜 및 시간을 밀리초까지 반환할 수 있는 날짜 관련 내장 함수이다.

정답 : X

밀리초까지 출력하려면 SYSTIMESTAMP를 사용하여야 한다.

3. 조건에 해당되는 행이 하나도 없을 경우, 집계함수 COUNT의 반환 결과는 NULL이다.

정답 : X

집계함수 수행 결과, 결과에 포함되는 행이 하나도 없을 경우, SUM, AVG 함수의 결과는 NULL이지만, COUNT함수의 결과는 0이 된다.

4. 다음 내장 함수의 결과는 무엇인가?

SELECT POWER(4, 3)
FROM Dual;

정답 : 64

POWER(숫자, n)는 숫자의 n제곱 값 계산이므로 4^3=64이다.

- 10일 -

1. 다양한 유형의 공공데이터를 다양한 목적으로 사용하기 위해서는 데이터포맷을 따르는 것은 중요하다.

정답 : O

맞는 설명이다.

2. Linked Data를 통해 관련된 다양한 데이터를 서로 연결함으로써 하나의 지식베이스처럼 사용이 가능한 데이터 포맷은 RDF(Resource Description Framework)이다.

정답 : X

LOD(Linked Open Data)는 시멘틱 웹이 표방하는 데이터 웹(Data Web)을 구체적으로 구현하는 방법으로 Linked Data를 통해 관련된 다양한 데이터를 서로 연결함으로써 하나의 지식베이스처럼 사용이 가능하다.

1. 오픈API는 공개되어 있어, 인증 없이 사용할 수 있다.

정답 : X

오픈 API의 핵심기술은 데이터 포맷, 고객인증, 프로토콜로 OAuth 인증, 키 발급 등을 통해 인증한 후에 사용할 수 있다.

2. 모바일 디바이스를 위한 서비스를 개발할 때, PC용 웹에 비해 화면크기, 네트워크 등의 제약이 없어 개발이 용이하다.

정답 : X

모바일 디바이스는 화면크기, 네트워크의 제약으로 인해 개발 시 고려해야 할 사항이 많다.

1. 메타데이터는 콘텐츠에 대해서 복수식별이 가능해야 한다.

정답 : X

메타데이터는 해당 콘텐츠에 대한 유일식별이 가능해야 하며, 모든 장르의 디지털콘텐츠 적용 가능해야 하고, 상호운용성을 확보하기 위해 국제표준을 지향 등 개발원칙을 따라 개발되어야 한다.

2. RDF(Resource Description Framework)는 공유 가능한 데이터와 메타데이터의 의미에 관한 내용을 기술하는 구조화된 메타데이터를 관리하는 시스템이다.

정답 : X

메타데이터 레지스트리는 공유가능한 데이터와 메타데이터의 의미에 관한 내용을 기술하는 구조화된 메타데이터를 관리하는 시스템이다.

3. 기본 스토리지 시스템에서 확보한 것, IT 시스템을 보다 효율적으로 관리하기 위해서 필요한 정보는 비즈니스메타데이터이다.

정답 : X

기본 스토리지 시스템에서 확보한 것, IT 시스템을 보다 효율적으로 관리하기 위해서 필요한 정보는 기술메타데이터이다.

4. 데이터 거버넌스는 기업의 데이터를 둘러싼 모든 기술적/비즈니스적인 내용을 다른 조직/부서/사용자들과 통합하기 위한 프레임워크이며, 법적인 규제 준수를 위해 핵심적인 역할을 한다.

정답 : O

맞는 설명이다.

1. 중장기 개방 계획은 기관별 보유 공공데이터 중 개방 가능한 공공데이터를 개방하기 위한 '5개년' 개방 계획을 수립한 것이다.

정답 : X

중장기 개방 계획은 3개년 개방 계획을 수립한 것이다.

2. 기관별 원천데이터(raw data) 형태로 개방하며, 국가안보, 개인정보 등을 모두 포함하여 개방하여야 한다.

정답 : X

기관별 원천데이터(raw data) 형태로 개방하되, 국가안보, 개인정보 등을 제외하고 개방하여야 한다.

1. 공공데이터 개방이행이란 '공공데이터 중장기 개방계획'을 기반으로 데이터를 추출하여 실제 데이터를 네이버, 다음 등 누구나 볼 수 있는 곳을 통해 개방하는 것을 의미한다.

정답 : X

공공데이터 개방 이행이란 ‘공공데이터 중장기 개방계획’을 기반으로 데이터를 추출하여 실제 데이터를 공공데이터포털(data.go.kr)에 등록 및 개방하는 것을 의미한다.

2. 공공데이터 개방과 관련한 용어정의로 알맞은 것은?

정답 : 각 기관이 비공개하기로 결정한 비공개 테이블 중 개방 가능여부를 재검토하는 것을 '비공개 테이블 재검토'라고 한다.

각 기관이 비공개하기로 결정한 보유 목록 중 개방 가능 여부를 재검토하는 것을 '비공개 테이블 재검토'라고 한다. 공공데이터 개방 확대를 위해 비공개 목록에 대한 재검토가 필요하다.

3. 공공데이터 개방과 관련하여 틀린 설명은?

정답 : 개방이행 후, 공공데이터 포털에서 자동으로 실적이 집계되기 때문에 따로 개방이행 실적 등록 절차가 없다.

개방이행 후, 이행실적 반영을 위해 이행점검 관리시스템에 개방목록명과 개방위치(URL정보)를 입력해야 한다.

1. 개방목록 및 보유 테이블을 수정하고자 할 경우, 수정권한이 필요 없다.

정답 : X

개방목록 및 보유목록을 수정하고자 할 경우 수정 권한이 필요하다. 수정을 위한 권한 부여를 위해 콜센터 1800-2907로 문의하면 된다.

2. ‘기관별 개방계획 검토’ 단계에서 중장기 개방계획 수립 이후, 정보시스템의 등록, 폐기 등 변경이 발생하는 경우, 개방 대상 정보시스템을 현행화하는 방법으로 맞지 않은 것은?

정답 : 소관 법령 등에 따라 데이터를 수집하기 위한 정보시스템을 더 이상 운영하지 않아 시스템을 폐기하는 경우, 다른 기관으로 시스템 관리 주체를 변경한다.

해당 기관의 소관 법령 등에 따라 데이터 수집을 위한 정보시스템을 운영하지 않고 폐기된 시스템의 경우는 '시스템 폐기' 등록 처리를 위한 작업을 수행해야 하며, '범정부 EA포털' 상에 폐기처리된 결과를 등록해야 한다.

1. 공공데이터 포털에서는 오픈API 데이터만 검색이 가능하다.

정답 : X

공공데이터 포털은 파일데이터, 오픈API, 표준데이터 검색이 가능합니다.

2. 공공데이터 포털은 데이터 시각화 서비스를 제공한다.

정답 : O

현재 개방 중인 데이터 혹은 본인이 만든 csv파일을 업로드하여 막대바, 버블형, 파이형 등의 시각화 차트를 만들 수 있고 게시할 수 있습니다. [데이터활용 - 공공데이터 시각화] 메뉴에서 확인할 수 있습니다.

3. 공공데이터 포털의 오픈API는 xml형태만 제공한다.

정답 : X

공공데이터 포털에서 오픈API의 제공형태는 기관마다 상이하나 xml, json, xml과 json을 둘 다 제공하는 총 3가지 방식으로 제공합니다.

1. 공공데이터 담당자 관리체계는 공공데이터 제공책임관, 공공데이터 실무담당자, 그리고 공공데이터 업무담당자로 구분된다.

정답 : O

공공데이터 담당자 관리체계는 기관의 총괄 책임자인 제공책임관, 업무 실무 총괄자인 실무담당자, 데이터를 보유하고 관리하는 업무 부서의 담당자인 업무담당자로 구분됩니다.

1. 공공데이터 포털에서 제공하는 데이터목록 종류에는 파일데이터, 오픈API, 표준데이터가 있다.

정답 : O

데이터 형식에는 hwp, xlsx, csv, zip, json, xml 등 다양한 형식이 있지만, 데이터 목록의 종류는 파일데이터, 오픈API, 표준데이터 총 3가지입니다.

1. PDF는 파일데이터 등록이 가능하다.

정답 : X

기계판독이 가능한 오픈포맷 3단계 이상의 파일만이 데이터 등록이 가능합니다. 특정 소프트웨어에서만 읽을 수 있는 데이터로 자유로운 수정, 변환이 불가한 pdf는 파일데이터 등록이 불가능합니다.

1. 제공신청은 7일 이내 처리를 해야 한다.

정답 : X

데이터 제공신청은 10일 내에 처리해야 하면 목록등록관리 메인페이지에서 10일 기한 중 0일전, 2일전 3일전 등을 확인할 수 있습니다.

1. 공공데이터의 품질관리를 위해 정부에서는 공공기관들을 대상으로 2년에 한 번씩 공공데이터 품질관리 수준을 평가하고 있다.

정답 : X

공공데이터 품질관리 수준평가는 매년 실시하고 있다.

2. 공공데이터DB의 유형을 자체생성형, 수집형, 제공형, 복합형 등으로 구분하는 이유는 각 유형별 특성에 따른 품질관리를 위해서다.

정답 : O

공공데이터DB의 유형을 이해하면 각 유형별 특성을 파악할 수 있고, 이에 따라 집중적인 품질관리 활동을 도출할 수 있다.

3. 품질(Quality)을 데이터 관점에서는 '사용하기에 적정한 수준'을 의미한다.

정답 : O

품질의 사전적 의미는 '물건의 성질과 바탕'을 의미하며, 데이터 관점에서는 사용하기에 적정한 수준(Fit For use)를 의미한다.

4. 공공데이터의 품질관리 범위는 구조화된 데이터로 한정되어 있으나, 점차 반구조화 데이터, 비정형데이터 등으로 확대할 예정이다.

정답 : O

공공데이터 품질관리 대상은 공공데이터법 제2조에 따라 공공기관이 생성 또는 취득하여 관리하고 있는 구조화된 데이터이다. 정부에서는 비정형데이터의 생성과 활용 등이 높아짐에 따라 비정형데이터의 품질관리를 위해 단계적으로 품질관리 대상을 확대해 나갈 계획이다.

1. 구축단계 데이터베이스 산출물 중에서 데이터 표준관리 산출에 해당하지 않는 것은?

정답 : 엔터티정의서

엔터티정의서는 데이터 구조와 관련된 산출물이다.

2. 구축단계 품질관리 주요활동으로 적절하지 않는 것은?

정답 : 데이터 품질관리 조직을 구성한다.

데이터 품질관리 조직의 구성은 계획단계부터 고려해야 할 품질관리 활동이다.

3. 공공데이터 품질관리는 데이터의 생애주기에 따라 계획, 구축, 운영, 활용의 4단계별로 품질관리 활동을 정의하고 있다.

정답 : O

공공데이터 생애주기는 데이터 생애주기를 고려하여, 계획단계, 구축단계, 운영단계, 활용단계로 구분하고, 각 단계별로 중요 품질관리 활동을 정의하고 있다.

1. 일경험 수련생이 수행하는 품질관리 업무에는 기관 보유 DB를 대상으로 데이터 값을 진단하고 개선하는 업무가 포함된다.

정답 : O

일경험 수련생이 기관에 배치되어 수행하는 주요 품질관리 업무는 데이터 값, 데이터 구조, 데이터 표준의 품질진단 및 개선이다.

2. 품질진단을 실시하기 전에 반드시 품질진단 기준이 정해져 있어야 한다.

정답 : O

품질진단을 실시하기 위해서는 사전에 품질진단의 기준이 정해져 있어야 한다.

3. 품질진단 결과에 문제가 있으면 기관담당자의 요청에 따라 재진단을 실시할 수 있다.

정답 : O

수련생이 품질진단을 수행한 후에 수행결과를 제출하면 기관담당자가 검토 후 재진단을 요청할 수 있으며, 수련생은 기관담당자의 요청에 따라 재진단을 수행할 수 있다.

1. 데이터 표준 품질진단 기준 중에서 컬럼정의 불일치는 대상DB 전체 테이블의 컬럼 정의(타입, 길이, 소수점 등)가 일관성이 있는지를 측정하는 것을 말한다.

정답 : O

데이터 표준 품질진단 기준은 컬럼정의 불일치, 범정부 공통표준용어 사용, 표준도메인 준수, 표준용어 준수 등이다. 컬럼정의 불일치는 대상 DB 전체 테이블의 컬럼 정의(타입, 길이, 소수점 등)가 일관성이 있는지를 측정하는 것으로 대상 DB 전체 테이블의 컬럼 중 컬럼명(영문기준)은 동일하나, 데이터타입, 길이, 소수점길이 등이 서로 상이한 컬럼을 진단하는 것이다.

2. 데이터 표준이란, '일관된 용어와 형식을 DB에 적용하는 활동'을 의미한다.

정답 : O

데이터 표준이란, '일관된 용어와 형식을 DB에 적용하는 활동'을 의미한다.

3. 정부에서는 공공기관이 보유하고 있는 DB에 일관되게 적용할 공통표준을 제공하고 있다.

정답 : O

정부에서는 공공기관이 보유하고 있는 DB에 일관되게 적용할 공통표준을 제공하고 있다.

4. 데이터 표준을 변경하면 이를 적용한 데이터 모델이나 응용프로그램에 영향을 미쳐 영향도가 매우 크다.

정답 : O

데이터 표준을 변경하면 이를 적용한 데이터 모델이나 응용프로그램에 영향을 미쳐 영향도가 매우 크다.

1. 데이터구조 품질진단 기준에서 미사용컬럼진단은 대상DB 전체 테이블 중에서 실제 사용하지 않는 테이블 현황을 측정하는 것을 말한다.

정답 : X

대상DB 전체 테이블 중에서 실제 사용하지 않는 테이블 현황을 측정하는 것은 미사용테이블진단이다.

2. 데이터 중복을 막기 위해 기본키(PK)를 설정하는 것이 중요하다.

정답 : O

데이터 중복을 막기 위해 기본키(PK)를 설정하는 것이 중요하다.

3. 미사용테이블 점검은 데이터 건수가 0인 테이블을 측정하는 것이다.

정답 : O

실제로 사용하는 테이블인지를 확인하기 위해 실시하는 미사용테이블 점검은 데이터 건수가 0인 테이블을 측정하는 것이다.

4. 오류율이란 진단한 모든 데이터 중에서 오류가 발견된 데이터의 비율을 의미한다.

정답 : O

오류율이란 진단한 모든 데이터중에서 오류가 발견된 데이터의 비율이다.

5. 컬럼불일치를 진단하기 위해서는 대상 DB의 데이터모델이 존재해야 한다.

정답 : O

컬럼불일치를 진단하기 위해서는 대상 DB의 데이터모델이 존재해야 한다.

6. 데이터의 열은 컬럼과 같은 의미이다.

정답 : O

데이터의 열은 컬럼, 속성, 특성, 필드, 변수 등 다양한 의미로 사용된다.

1. 불필요한 공백, 특수문자가 입력된 오류를 측정하는 것은 유효성 진단에 해당한다.

정답 : X

불필요한 공백, 특수문자가 입력된 오류를 측정하는 것은 완전성 진단에 해당한다.

2. "결혼여부가 'Y'(=기혼)이면, 결혼일자가 존재해야 한다"는 데이터요건이 존재하는 경우, 이를 위배하는 데이터를 진단하는 것이 '논리관계 일관성' 진단이다.

정답 : O

"결혼여부가 'Y'(=기혼)이면 결혼일자는 존재해야 한다", "등록여부가 'Y'(=등록)인 경우 등록일자는 반드시 존재해야 한다" 등과 같이 데이터 규칙이나 논리적인 데이터 관리 요건이 존재하는 경우, 이를 위배하는 데이터를 진단하는 것이 '논리관계 일관성' 진단이다.

3. 번호생성 규칙을 위배한 데이터 오류를 측정하는 것은 유효성진단에 해당한다.

정답 : O

번호생성 규칙을 위배한 데이터 오류를 측정하는 것은 유효성진단에 해당한다.

4. 시간순서일관성 진단은 정합성 진단에 해당한다.

정답 : O

시간순서일관성 진단은 정합성 진단에 해당한다.

5. 품질진단은 오류가 아닌 데이터를 찾아내는 것이다.

정답 : X

품질진단을 수행하는 목적은 오류 데이터를 찾아내는 것이다.

6. 데이터 품질진단하는 방법에는 직접진단과 간접진단이 존재한다.

정답 : O

데이터 품질진단하는 방법에는 직접진단과 간접진단이 존재한다.

- 12일 -

1. 표준화란 사물의 정도, 성격 따위를 알기 위한 근거나 기준을 말한다.

정답 : X

표준화는 근거나 기준을 마련하는 일련의 활동이고, 표준은 표준화를 통해 만들어진 근거나 기준을 말합니다.

2. 공공기관이 공공데이터베이스에 대한 계획, 구축, 운영, 개방 등 업무 운영에 적용하는 표준은 상위기관의 표준을 준용해야 한다.

정답 : O

공공기관이 공공데이터베이스에 대한 계획, 구축, 운영, 개방 등의 업무 운영에 적용하는 표준은 상위기관의 표준을 준용해야 합니다.

3. 데이터는 구조 데이터와 값 데이터가 있으며, 구조데이터는 메타데이터라고도 한다.

정답 : O

데이터는 구조 데이터와 값 데이터가 있으며, 구조데이터는 메타데이터라고도 합니다.

4. 데이터 표준화를 하는 목적은 누구나 같은 의미로 이해하고 같은 방법으로 사용하도록 근거나 기준을 마련하기 위함이다.

정답 : O

데이터 표준화를 하는 목적은 누구나 같은 의미로 이해하고 같은 방법으로 사용하도록 근거나 기준을 마련하기 위함입니다.

1. 데이터 표준화 시 최신 공통표준용어를 수집하여 준용할 필요가 없다.

정답 : X

최신 공통표준용어를 수집하여 데이터 표준화 시 준용해야 한다.

1. 표준화 기준 정의는 데이터 표준화 기준과 표준 관리 기준을 정의하는 것이다.

정답 : O

표준화 기준 정의는 데이터 표준화 기준과 표준화를 통해 만들어진 표준의 관리 기준을 정의하는 것입니다.

1. 데이터 표준화 대상 선정 시 우선적으로 선정해야 하는 것은 무엇인지 고르시오.

정답 : 표준화 대상 DB 선정

데이터 표준화 대상 선정 시 우선적으로 표준화 대상 DB를 선정하고 테이블, 컬럼을 선정해야 합니다.

1. 단어 표준화 시 단어명은 띄어쓰기하지 않는다.

정답 : O

단어 표준화 시 단어명은 띄어쓰기하지 않는다.

2. 단어표준화 시 단어명 생성 시 접두사, 접미사는 복합어로 정의할 수 없다.

정답 : X

접두사는 단일어의 앞에 붙어 복합어로 정의할 수 있다. 접미사는 단일어의 뒤에 붙어 복합어로 정의할 수 있다.

1. 데이터 도메인 표준화 시 도메인명은 "도메인분류명+데이터타입+데이터길이(선택)"형태로 정의한다.

정답 : O

데이터 도메인 표준화 시 도메인명은 "도메인분류명+데이터타입+데이터길이(선택)"형태로 정의합니다. 예시: 연월C4

2. 도메인 표준화 시 도메인 분류명이 "여부"인 경우 유효값은 "Y" 또는 "N"과 같이 2개의 값만 허용한다.

정답 : O

여부는 그러함(Y)과 그러하지 아니함(N)을 구분하는 코드를 말한다.

1. 용어명 생성 시 단어 목록, 도메인 목록에 필요한 단어와 도메인명이 없는 경우 용어를 먼저 생성하고 나중에 단어 목록, 도메인 목록에 생성해도 된다.

정답 : X

용어명 생성에 필요한 단어와 도메인명이 없는 경우 먼저 단어 표준화, 도메인 표준화를 통해 단어 목록, 도메인 목록에 생성하고 이후 용어를 생성해야 한다.

1. 코드값에 해당하는 명칭을 "코드값의미"라고 한다.

정답 : O

코드값에 해당하는 명칭을 '코드값의미'라고 한다.

2. 데이터 표준 적용률 산정에 관련된 설명입니다. 잘못된 것을 고르시오.

정답 : 시스템 테이블도 데이터 표준 적용률 산정 대상이다.

시스템 테이블은 표준 적용률 산정 시 제외합니다.

- 13일 -

1. 데이터 모델링은 데이터를 조각조각 파악하는 것이 아니라 데이터를 전반적으로 파악해서 업무수행에서 최적의 구조가 어떤 것인지 도출하는 것이다.

정답 : O

데이터 모델링은 데이터를 조각조각 파악하는 것이 아니라 데이터를 전반적으로 파악해서 업무수행에서 최적의 구조가 어떤 것인지 도출하는 것입니다.

2. 데이터 모델링 기법 중에는 엔티티타입, 관계, 속성, 식별자 등이 있다.

정답 : O

데이터 모델링 기법 중에는 주제영역, 엔티티타입, 관계, 속성, 식별자, 서브타입 등이 있다.

1. 공통적으로 관련된 중요 엔티티타입을 중심으로 상위 레벨 수준의 데이터 모델링을 논리 모델링이라고 한다.

정답 : X

공통적으로 관련된 중요 엔티티타입을 중심으로 상위 레벨 수준의 데이터 모델링은 개념모델링이라고 한다.

1. 물리적으로 테이블에 식별자(PK)를 정의하지 않으면 중복 데이터가 발생할 수 있고, 데이터 집합이 명확하지 않아 테이블 간 관계가 부정확할 수 있습니다.

정답 : O

물리적으로 테이블에 식별자를 정의하지 않으면 중복 데이터가 발생할 수 있습니다.

1. 데이터 품질진단은 준수되어야 하는 데이터 값의 유효성, 정확성, 표준 적용 여부 등이 도메인 속성에 위배되어 잠재적으로 업무에 영향을 줄 수 있는 오류 데이터를 파악하기 위한 분석기법이다.

정답 : O

맞는 설명이다.

2. 데이터 품질진단은 데이터를 저장하는 시점에만 진행하면 된다.

정답 : X

데이터의 저장, 연계, 가공, 활용 등 데이터에 변경이 발생하는 모든 영역에서 수시로 값 진단을 수행하여 데이터의 오류를 사전에 파악하고 예방해야 한다.

3. 데이터 품질진단의 효과는 데이터의 신뢰도와 일관성을 확보 및 향상 시켜 데이터 기반의 경영이 가능해지고, 다양한 분석정보를 이용하여 통합, 연계, 대국민 서비스 등의 토대를 마련할 수 있다.

정답 : O

맞는 설명이다.

1. 데이터 품질점검 기준에서 통계 및 계산 값이 정확하게 관리되고 있는지 측정하는 점검기준은 선후관계 정확성 진단이다.

정답 : X

통계 및 계산 값이 정확하게 관리되고 있는지 측정하는 데이터 품질진단 기준은 계산 및 집계 정확성 진단이다.

2. 코드 도메인 진단은 컬럼의 저장된 값이 유효값(2개의 값)의 범위를 벗어나는 데이터 오류를 측정하는 진단이다.

정답 : X

여부 도메인 진단에 대한 설명이다.

3. 참조무결성은 테이블 간의 관계를 분석하여 참조하는 컬럼과 참조되는 컬럼 사이의 일관성을 유지하는 것을 의미한다.

정답 : O

맞는 설명이다.

1. 데이터 품질진단 결과 도출된 오류 데이터의 발생원인을 분석할 수 있지만, 잘못된 오류데이터를 임의로 수정하여 개선하면 안 된다.

정답 : X

도출된 오류데이터를 분석하고 개선가능여부를 조사하여 데이터품질을 높이기 위해 오류 데이터를 개선할 수 있다.

2. 진단대상으로 선정된 DB에 접속하기 위한 정보와 진단수행 PC에서의 접근 권한을 확보하는 단계는 품질진단 수행 단계의 업무이다.

정답 : X

품질진단 환경 준비단계에 대한 설명이다.

1. 데이터 품질에서의 프로파일링이란, 진단대상 데이터베이스의 현황분석을 위한 자료 수집, 데이터의 통계, 패턴 등을 수집하여 잠재적 오류 징후를 발견하는 방법이다.

정답 : O

맞는 설명이다.

2. 데이터 프로파일링은 일반적으로 하향식접근 방법으로 높은 레벨부터 분석을 시작하여 좀 더 단순한 분석으로 세분화시켜 정확성을 높여나간다.

정답 : X

데이터 프로파일링은 일반적으로 상향식접근 방법으로 낮은 레벨부터 분석을 시작하여 좀 더 복잡한 분석으로 구체화시켜 정확성을 높여나간다.

1. 여부 도메인은 유효값이 3개 이상일 수 있다.

정답 : X

여부 도메인은 유효값이 반드시 2개 여야 한다.

2. 날짜 컬럼에서 시간에 대한 선후 관계가 존재하는 경우 시간순서 일관성을 검증한다.

정답 : O

맞는 설명이다.

- 14일 -

1. 데이터품질관리시스템은 블랙박스처럼 감춰진 DB 데이터의 유효성 등을 검증하여 오류데이터를 찾아내고 개선 활동 등을 지원하는 기능을 포함하고 있는 시스템이다.

정답 : O

맞는 설명이다.

2. 데이터품질진단 수행 절차 중 테이블 스키마 수집은 진단대상관리 절차이다.

정답 : O

맞는 설명이다.

3. 진단대상DB에서 수집된 테이블은 모두 진단수행을 해야 한다.

정답 : X

진단대상DB에서 수집한 테이블 목록은 진단대상여부를 조정할 수 있다.

4. 진단대상으로 선정한 테이블은 데이터의 범위를 조정할 수 있다.

정답 : O

맞는 설명이다.

5. 진단실행은 예약 스케쥴링할 수 있다.

정답 : O

맞는 설명이다.

6. 진단결과보고서는 엑셀문서로 다운로드할 수 있다.

정답 : O

맞는 설명이다.

7. 참조무결성 진단규칙 설정은 부모테이블에만 설정하면 된다.

정답 : X

부모테이블과 자식테이블의 컬럼을 모두 설정해야 한다.

8. 데이터품질관리시스템의 품질진단 결과는 진단대상DB에 저장하여 관리된다.

정답 : X

데이터품질관리시스템의 품질진단 결과는 데이터품질관리시스템 DB에 저장하여 관리된다.

9. DB진단도구툴로 도메인 진단을 하는 경우 분석SQL을 직접 작성해야 한다.

정답 : X

DB진단도구툴로 도메인 진단을 하는 경우 분석SQL은 자동으로 생성된다.

1. 진단대상DB를 연결하지 않아도 컬럼분석(프로파일링)을 할 수 있다.

정답 : X

진단대상DB를 연결하고, 스키마를 수집한 후 컬럼분석(프로파일링)을 수행할 수 있다.

2. 컬럼분석(프로파일링)을 수행하면 데이터 분포현황, Null/Not Null 건수 및 비율, 최대값, 최소값 등을 분석할 수 있다.

정답 : O

맞는 설명이다.

3. 진단규칙(검증룰)은 사용자가 임의로 추가할 수 없다.

정답 : X

진단규칙(검증룰)은 사용자가 신규로 추가할 수 있다.

4. 참조무결성 진단은 부모/자식관계로 맺어진 데이터 값들에 대하여 일관성이 유지되고 있는지 진단하는 것이다.

정답 : O

맞는 설명이다.

5. 컬럼분석(프로파일링) 실행 시 일부컬럼은 제외 처리할 수 있다.

정답 : O

맞는 설명이다.

6. 진단대상테이블관리에서 백업, 로그테이블은 진단제외할 수 없다.

정답 : X

백업, 로그, 시스템 테이블은 진단제외할 수 있다.

7. 진단대상DB등록 후 특정 스키마를 진단제외할 수 있다.

정답 : O

맞는 설명이다.

8. 진단대상DB등록 시 여러 개의 진단DB를 등록할 수 있다.

정답 : O

맞는 설명이다.

9. 각 컬럼에 진단규칙을 설정하지 않아도 진단실행이 가능하다.

정답 : X

각 컬럼에 진단규칙을 설정해야 진단실행이 가능하다.

1. 파일진단 도구 Tool은 csv파일만 진단수행이 가능하다.

정답 : O

맞는 설명이다.

2. 파일진단 도구 Tool은 진단시작행을 지정하지 않아도 진단수행이 가능하다.

정답 : X

csv파일열기 후 반드시 진단시작행 지정 후 시작버튼을 클릭하여 진단규칙을 지정하고 진단수행을 해야 된다.

3. 파일진단 도구 Tool은 번호 도메인 유형은 검증룰을 신규로 추가할 수 없다.

정답 : O

맞는 설명이다.

4. 파일진단 도구 Tool은 여부 도메인 유형은 검증룰을 신규로 추가할 수 있다.

정답 : O

맞는 설명이다.

1. 파일진단 도구 Tool을 이용하여 진단수행 후 진단결과보고서를 엑셀로 다운로드할 수 없다.

정답 : X

진단결과보고서를 엑셀로 다운로드할 수 있다.

2. 파일진단 도구 Tool에서 계산식 검증룰은 산식, 합계 2가지 유형이 있다.

정답 : O

맞는 설명이다.

3. 파일진단 도구 Tool에서 주차할인율 컬럼은 수량 도메인 진단규칙으로 지정한다.

정답 : X

주차할인율 컬럼은 율 도메인 진단규칙으로 지정한다.

4. 파일진단 도구 Tool에서 계산식-합계 진단규칙 설정 시 합계컬럼은 2개만 선택가능하다.

정답 : X

합계컬럼은 여러 개 선택 가능하다.

- 15일 -

1. 현존하는 가장 오래된 지도는 기원전 몇 년인가?

정답 : 기원전 600년

현존하는 가장 오래된 지도는 기원전 600년에 점토로 만들어진 지도이다.

2. 공공기관에서 제공하는 대표적인 3차원 지도서비스는 무엇인가?

정답 : 브이월드

브이월드는 공공기관에서 제공하는 대표적인 3차원 지도서비스이다.

1. 공공데이터 개방표준이란, “공공기관이 활용도가 높은 공공데이터 제공할 때 제공하는 데이터셋에 공통적으로 적용해야 하는 기준”을 말한다.

정답 : O

공공데이터 개방표준이란, “공공기관이 활용도가 높은 공공데이터 제공할 때 제공하는 데이터셋에 공통적으로 적용해야 하는 기준”을 말한다.

1. 공공데이터 개방표준(고시)에서 표준데이터셋의 구성항목은 크게 기본정보와 상세정보로 구분하여 구성되어 있다.

정답 : O

공공데이터 개방표준(고시)에서 표준데이터셋의 구성항목은 크게 기본정보와 상세정보로 구분하여 구성되어 있다.

2. 표준데이터셋 생성 및 제공 시 제공방식은 반드시 데이터파일로 제공해야 한다.

정답 : X

각 제공기관은 표준데이터셋을 ‘데이터파일 다운로드’와 ‘오픈 API’ 두 가지 방식 중 하나를 선택하여 제공할 수 있다.

3. 표준데이터셋은 개방표준을 준수하여 생성한 데이터셋을 말한다.

정답 : O

표준데이터셋은 개방표준을 준수하여 생성한 데이터셋을 말한다.

1. CSV 파일형식으로 개방데이터를 제공하는 경우, 1행은 항목명을 기재하고, 2행부터 데이터를 입력한다.

정답 : O

개방표준 데이터를 CSV 파일형식으로 제공하는 경우, 1행은 항목명을 기재하고, 2행부터 데이터를 입력한다.

1. 표준데이터셋 점검을 위해 개방표준데이터 점검서비스를 제공하고 있다.

정답 : O

표준데이터셋 점검을 위해 개방표준데이터 점검서비스를 제공하고 있다.

1. 지번주소는 건물기준으로 부여되는 주소를 의미한다.

정답 : X

지번주소는 토지를 기준으로 부여되는 주소를 의미하며, 토지 매매 등 재산권 보호의 목적으로 사용된다.

2. 공공데이터의 주요 위치정보에는 지번주소, 도로명주소, 좌표 등이 있다.

정답 : O

공공데이터의 주요 위치정보에는 지번주소, 도로명주소, 좌표 등이 있다.

1. 아래의 도로명주소에 대한 설명으로 잘못된 것은?

(도로명주소) 한누리대로 411

정답 : 한누리대로는 도로폭 2~7차이다.

00대로 : 도로폭이 8차로 이상
00로 : 도로폭이 2~7차로
00길 : '로'보다 좁은 도로

1. 좌표값 기준은 WGS84좌표계를 사용하며, 소수점 이하 6자리~10자리로 좌표값을 입력해야 한다.

정답 : O

좌표값 기준은 WGS84좌표계를 사용하며, 소수점 이하 6자리~10자리로 좌표값을 입력해야 한다.

2. 좌표값은 위도와 경도값으로 정의한다.

정답 : O

좌표값은 위도와 경도 값으로 정의한다.

1. 실측절차는 실측대상 수집확인 후 기관의 업무에 따라 온라인실측과 현장실측으로 진행되는 것이 일반적이다.

정답 : O

실측절차는 실측대상 수집확인 후 기관의 업무에 따라 온라인실측과 현장실측으로 진행되는 것이 일반적이다.

1. 공문서의 편집용지를 등록할 때는 프로그램 상단의 [파일]-[편집용지]-[구성]메뉴를 사용한다.

정답 : X

공문서의 편집용지를 등록할 때는 [파일]-[편집용지]메뉴로 호출한 [편집용지] 대화상자의 [구성]버튼을 사용한다.

2. 1개의 문단에서 첫 줄의 첫 글자의 세로위치에 맞춰서 다음 줄의 첫 글자도 같은 위치에 오게 하는 기능은 첫 줄의 들여쓰기이다.

정답 : X

1개의 문단에서 첫 줄의 첫 글자의 세로위치에 맞춰서 다음 줄의 첫 글자도 같은 위치에 오게하는 기능은 첫 줄의 내어쓰기이다.

3. 편집용지의 단축키는 [F7]이다.

정답 : O

편집용지의 단축키는 [F7]을 사용한다.

4. 엑셀차트를 한글문서에 복사&붙여넣기로 넣을 수 없다.

정답 : X

엑셀차트를 한글문서에 복사&붙여넣기로 넣을 수 있다.

5. 한 글자의 폭은 장평으로 기본값은 100%이다.

정답 : O

한 글자의 폭은 장평으로 기본값은 100%이다.

저작자표시 (새창열림)

'공공 데이터 교육' 카테고리의 다른 글

데이터 사이언스 3가지 (0)	2021.08.31
공공데이터 데이터 분석 (0)	2021.08.30
공공 데이터 15일 (0)	2021.07.03
공공 데이터 14일 (0)	2021.07.03
공공 데이터 13일 (0)	2021.07.02

데이터 너구리

공공 데이터 시험 요약

'공공 데이터 교육' 카테고리의 다른 글

티스토리툴바

공공 데이터 시험 요약

'공공 데이터 교육' 카테고리의 다른 글

'공공 데이터 교육' Related Articles

티스토리툴바