adsp 5

[250217] ADsP 준비 5

3과목 R 시작 벡터 요약벡터는 동질적이다벡터는 위치로 인덱스된다A[3]은 A벡터의 3번째 위치이다참고사항NaNNot a Number의 약자로 음수의 제곱근을 구하려고 시도하는 것과 같은 경우 오류와 함께 숫자가 아님을 반환한다. NA/NULLNot Available의 약자인 NA와 NULL은 결측값을 의미한다NA : 공간을 차지하는 결측값NULL : 공간을 차지하지 않는 존재하지 않는 결측값

adsp 2025.02.17

[250212] ADsP 준비 (4)

01 마스터플랜 수립 프레임워크- 분석 과제의 우선순위와 적용 범위 및 방식을 종합적으로 고려하여 최종적으로 분석 구현의 로드맵을 수립한다. 이러한 일련의 과정과 형식을 마스터플랜 수립 프레임워크라고 함 - 빅데이터의 특징을 고려한 분석 ROI 요소빅데이터 특징을 고려한 분석 ROI 요소로는 크게 투자 비용 요소와 비즈니스 효과 요소가 있다빅데이터의 특징인 4V를 ROI 관점으로 살펴보면, 크기 (Volume), 다양성 (Variety), 속도 (Velocity)dml 3V는 투자비용 측면의 요소라고 볼 수 있다크기 : 데이터의 규모 및 양을 의미, 대용량 데이터를 저장/처리하고 관리하기 위해서는 새로운 투자가 필요하다다양성 : 다양한 종류의 형태를 가진 데이터를 입수하는 데에 있어 투자가 필요하다속도 ..

adsp 2025.02.13

[250210] ADsP 준비 (3)

[2과목]01 데이터 분석 기획1. 분석 기획의 정의분석 기획이란 실제 분석을 수행하기 전, 분석을 수행할 과제의 정의 및 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 작업을 의미어떠한 목표(What)를 달성하기 위하여 어떠한 데이터를 가지고 어떠한 방식(How)으로 수행할지에 대한 일련의 계획을 수립하는 중요한 사전작업이다. 2. 분석 기획의 특징데이터 사이언티스트의 요구 역량인 수학/통계학적 지식, 분석 도구인 데이터 및 프로그래밍 기술, 해당 비즈니스에 대한 이해와 전문성에 대한 고른 역량과 시각 등이 요구된다. 3. 분석 대상과 방법에 따른 4가지 분석 주제해결해야 할 문제, 분석 대상이 무엇인지 알고 분석 방법도 알고 있다면 '최적화'분석 대상이 무엇인지 알고 있지만 방법을 모른다면..

adsp 2025.02.13

[250207] ADsP 준비 (2)

- 빅데이터는 3V (데이터의 양 : Volume, 데이터 유형의 다양성 : Variety, 데이터 수집.처리의 속도 : Velocity)가 급격히 증가하면서 나타난 현상→ 가치 : Value, or 정확성 : Variability를 포함해 빅데이터의 특징을 설명하기도 함 - 빅데이터 3가지 출현 배경산업계 (고객 데이터 축적)산업계에서 일어난 빅데이터 현상을 양질 전환 법칙으로 설명할 수 있다. 이는 양적인 변화가 축적되면 질적인 변화도 이루어진다는 개념이다. 학계 (거대 데이터 활용, 과학 확산)학계에서도 빅데이터를 다루는 현상들이 늘어나면서 필요한 기술 아키텍쳐 및 통계 도구들이 지속적으로 발전ex. 게놈 프로젝트, NASA의 기후 시뮬레이션 등기술발전 (관련 기술의 발달)디지털화의 급진전, 저장 ..

adsp 2025.02.07

[250205] ADsP 준비(1)

- 정성적 데이터와 정량적 데이터정성 데이터 : 언어. 문자 등으로 표현 (ex. 설문조사, sns 데이터 등)정량 데이터 : 수치, 기호, 도형 등 수치로 명확하게 표현 (41kg, 31세)-> 분석하기 편한 것은 정량 데이터 - 정형 데이터, 비정형 데이터, 반정형 데이터정형 데이터 : 고정된 틀이 있으며 연산이 가능 (CSV, 엑셀, 스트레드시트, 관계형 DB 등)비정형 데이터 : 고정된 틀이 없으며 연산이 불가능 (NoSQL, 영상, 음성)반정형 데이터 : 고정된 틀을 가지고 있지만 연산이 불가능 (HTML, JSON, XML)- 암묵지와 형식지암묵지 : 학습과 체험을 통해 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식형식지 : 교과서, 메뉴얼 등 형상화된 지식, 공유할 수 있는 지식표출화 ..

adsp 2025.02.05