전체 글 123

[팀아티클] 그 데이터는 잘못 해석되었습니다, 데이터 리터러시를 올리는 방법

[250218] 선정 아티클 : 그 데이터는 잘못 해석되었습니다그 데이터는 잘못 해석되었습니다 | 요즘IT 개인 요약생존자 편향의 오류: 데이터를 분석할 때 생존자만을 고려하면 잘못된 결론에 이를 수 있습니다. 예를 들어, 전투기의 총탄 자국이 많은 부분이 아닌 적은 부분을 보강해야 한다는 통계학자의 조언처럼, 이탈 고객이 아닌 전체 고객을 기준으로 분석해야 합니다.심슨의 역설: 전체 지표와 그룹별 지표가 상반된 결론을 낼 수 있습니다. 예를 들어, A 서비스는 성별 만족도에서 높은 점수를 받았지만, 전체 만족도에서는 B 서비스보다 낮았습니다. 이는 각 그룹의 사용자 수 차이 때문입니다.상관관계를 통한 성급한 일반화: 상관관계는 인과관계가 아니므로, 두 지표 간의 상관관계를 성급히 일반화하지 말아야 합니..

아티클 스터디 2025.02.20

[250219] sql 기본 (replace, substr, concat, if, case)

- replace [select]replace (바꿀 위치, 현재값, 정정할 내용)예제식당 명의 ‘Blue Ribbon’ 을 ‘Pink Ribbon’ 으로 바꾸기select restaurant_name "원래 상점명", replace(restaurant_name, 'Blue', 'Pink') "바뀐 상점명"from food_orderswhere restaurant_name like '%Blue Ribbon%' - substring [select]substr(조회 할 컬럼, 시작 위치, 글자 수)예제서울 음식점들의 주소를 전체가 아닌 ‘시도’ 만 나오도록 수정select addr "원래 주소", substr(addr, 1, 2) "시도"from food_orderswhere addr ..

sql 2025.02.19

[250218] sql 기본 (수치 연산)

함수sum (합계), avg (평균), count (수 세기), 근데 이때 select 부분에 사용해야 함 예제. 주문 금액이 3만원 이상인 주문건의 갯수 구하기select COUNT(1)from food_orderswhere price >=30000예제 2. 한국 음식의 주문 당 평균 금액 구하기내가 한 오답SELECT COUNT(cuisine_type = 'korean')from food_orderswhere AVG(price) 정답select AVG(price)from food_ordersWHERE cuisine_type = 'Korean' GROUP BY : 카테고리 지정 연산 select 카테고리컬럼(원하는컬럼 아무거나), sum(계산 컬럼),fromgroup by 카테고리컬럼(원하는..

sql 2025.02.18

<팀과제> 직무데이터 분석 요약

재무빅데이터분석사 - 백경우주요역할 디지털 전환에 따른 금융·회계 분야 변화✅  전통적인 회계·세무 지식뿐만 아니라 데이터 분석 능력까지 갖추고 있어, 기업의 재무 데이터를 보다 정교하게 분석하고 의사결정에 활용할 수 있습니다.기업의 리스크 관리 및 내부감사 강화✅  빅데이터 분석을 활용해 이상거래 탐지(Forensic Accounting), 내부 통제 및 감사 프로세스를 자동화하고, 회계 부정을 사전에 예방하는 역할을 수행할 수 있습니다. AI 및 데이터 기술의 금융·회계 분야 적용 확대✅  AI 기반의 회계 데이터 분석, 재무 예측 모델링, 머신러닝을 활용한 이상 징후 탐지 등의 역할을 수행할 수 있어, 금융·회계 업계의 디지털 혁신을 주도하는 핵심 인재로 자리 잡을 수 있습니다. 데이터 분석이 가능..

카테고리 없음 2025.02.18

[250217] ADsP 준비 5

3과목 R 시작 벡터 요약벡터는 동질적이다벡터는 위치로 인덱스된다A[3]은 A벡터의 3번째 위치이다참고사항NaNNot a Number의 약자로 음수의 제곱근을 구하려고 시도하는 것과 같은 경우 오류와 함께 숫자가 아님을 반환한다. NA/NULLNot Available의 약자인 NA와 NULL은 결측값을 의미한다NA : 공간을 차지하는 결측값NULL : 공간을 차지하지 않는 존재하지 않는 결측값

adsp 2025.02.17

[250217] sql 기본 (select from, where, between, in, like)

SQL 공부 1일차- 실행 = ctrl + enter 1. 오늘 학습 키워드select from, where, between, in, like 2. 오늘 학습 한 내용을 나만의 언어로 정리하기select (컬럼명) from (테이블명) : 범위 선택select ~ as 별명 : 결과값이 별명으로 나옴또는 원래이름 후 한칸 띄고 별명도 가능select order_id as ord_no,restaurant_name "식당 이름"from food_orders→ order_id 가 ord_no로, restaurant_name이 식당 이름으로 표기되어 결과값이 나옴where 조건문문자일때 ' '비교연산자 ,=, (같지 않다) between : A와  B 사이컬럼 between a and b  in : '포함'하..

sql 2025.02.17

[250212] ADsP 준비 (4)

01 마스터플랜 수립 프레임워크- 분석 과제의 우선순위와 적용 범위 및 방식을 종합적으로 고려하여 최종적으로 분석 구현의 로드맵을 수립한다. 이러한 일련의 과정과 형식을 마스터플랜 수립 프레임워크라고 함 - 빅데이터의 특징을 고려한 분석 ROI 요소빅데이터 특징을 고려한 분석 ROI 요소로는 크게 투자 비용 요소와 비즈니스 효과 요소가 있다빅데이터의 특징인 4V를 ROI 관점으로 살펴보면, 크기 (Volume), 다양성 (Variety), 속도 (Velocity)dml 3V는 투자비용 측면의 요소라고 볼 수 있다크기 : 데이터의 규모 및 양을 의미, 대용량 데이터를 저장/처리하고 관리하기 위해서는 새로운 투자가 필요하다다양성 : 다양한 종류의 형태를 가진 데이터를 입수하는 데에 있어 투자가 필요하다속도 ..

adsp 2025.02.13

[250210] ADsP 준비 (3)

[2과목]01 데이터 분석 기획1. 분석 기획의 정의분석 기획이란 실제 분석을 수행하기 전, 분석을 수행할 과제의 정의 및 결과를 도출할 수 있도록 관리하는 방안을 사전에 계획하는 작업을 의미어떠한 목표(What)를 달성하기 위하여 어떠한 데이터를 가지고 어떠한 방식(How)으로 수행할지에 대한 일련의 계획을 수립하는 중요한 사전작업이다. 2. 분석 기획의 특징데이터 사이언티스트의 요구 역량인 수학/통계학적 지식, 분석 도구인 데이터 및 프로그래밍 기술, 해당 비즈니스에 대한 이해와 전문성에 대한 고른 역량과 시각 등이 요구된다. 3. 분석 대상과 방법에 따른 4가지 분석 주제해결해야 할 문제, 분석 대상이 무엇인지 알고 분석 방법도 알고 있다면 '최적화'분석 대상이 무엇인지 알고 있지만 방법을 모른다면..

adsp 2025.02.13

[250207] ADsP 준비 (2)

- 빅데이터는 3V (데이터의 양 : Volume, 데이터 유형의 다양성 : Variety, 데이터 수집.처리의 속도 : Velocity)가 급격히 증가하면서 나타난 현상→ 가치 : Value, or 정확성 : Variability를 포함해 빅데이터의 특징을 설명하기도 함 - 빅데이터 3가지 출현 배경산업계 (고객 데이터 축적)산업계에서 일어난 빅데이터 현상을 양질 전환 법칙으로 설명할 수 있다. 이는 양적인 변화가 축적되면 질적인 변화도 이루어진다는 개념이다. 학계 (거대 데이터 활용, 과학 확산)학계에서도 빅데이터를 다루는 현상들이 늘어나면서 필요한 기술 아키텍쳐 및 통계 도구들이 지속적으로 발전ex. 게놈 프로젝트, NASA의 기후 시뮬레이션 등기술발전 (관련 기술의 발달)디지털화의 급진전, 저장 ..

adsp 2025.02.07

[250206] RIDI-데이터 분석으로 유저의 마음을 읽는 서비스가 되려면 / 데이터를 쉽게 찾고 잘 활용할 수 있는 기반을 만드는, 토스 Data Analytics Engineer

선정 아티클 : 데이터 분석으로 유저의 마음을 읽는 서비스가 되려면데이터 분석, 유저의 마음을 읽는 서비스가 되려면 - 리디주식회사 RIDI Corporation개인 요약박지현해당 아티클을 읽고 새롭게 알게 된 것, 앞으로 나의 방향성에 대한 회고가 있다면 적어주세요. 인사이트가 가장 중요합니다.서비스 운영 = 가설 세우고 검증의 연속, 데이터 : 가설 검증 도구데이터를 잘 분석하기 위해선 프로젝트 환경을 둘러싼 맥락 이해 우선. 커뮤니케이션 → 시각화 중요 !, 동료에 대한 신뢰 (각각 해석과 판단에는 주관 개입 때문)- 코파일럿 요약 데이터 분석의 필요성: 데이터 분석은 직장인들에게 중요한 직무 역량으로 여겨지고 있으며, 많은 비전공자들도 데이터 분석에 관심을 가지고 있습니다.리디의 접근 방식: 콘텐..

아티클 스터디 2025.02.06