|
홈 > 국비교육 > 인공지능ㆍ빅데이터 > 파이썬 기반의 빅데이터 방법론을 활용한 데이터 분석 전문가 양성과정
교육장소
○ 새싹(SeSAC) 금천캠퍼스
•위치 : 서울시 금천구 가산로 70
*코로나 단계가 하향되지 않을 경우 일부 온라인으로 교육이 운영됨
수강대상
❍ 수강신청일 기준, 만 15세 이상의 서울시민(주소지 등록 기준)이면서 분야별 기초지식을 갖추고 교육 수료 후 개발자로 진출하고자 하는 분
신청방법
※ 두 단계를 '모두' 진행해주셔야 정상적으로 신청이 완료됩니다.
① 싹 홈페이지(ssac.seoul.kr) 회원 가입 후, 페이지 상단의 '수강신청하기' 버튼을 눌러서 수강 신청을 해주세요.
② 마이페이지-> 자기소개서(구글폼 및 설문지)를 작성해주세요.
* 교육과정 문의처 : iebpr@naver.com
교육목표
- 데이터 분석을 위한 Python 프로그래밍 기초를 학습
- 정형/비정형 데이터 수집/가공/처리 과정을 실습
- 빅데이터 방법론(CRISP-DM) 이해 및 단계별 Task 실행단계를 실습
- 데이터 시각화하는 방법을 학습하고 실습
- 각 과목별 프로젝트를 수행하고 평가를 수행 / 배운 내용을 토대로 실무 프로젝트를 수행
< 교육과정 수료 후 습득 역량>
- 파이썬 프로그램 작성 가능
- 정형/비정형 데이터 수집/가공/처리
- 빅데이터 방법론을 통한 단계별 데이터 모델을 통한 분석 및 결과 도출
- 빅데이터 시각화 툴을 활용한 구현 가능
- 빅데이터를 가지고 수집/가공/처리/모델링/평가 과정을 통한 빅데이터 프로젝트 구현/문서화/발표 역량 습득 가능
교육내용
<강사이력>
○ 한국산업기술협회 빅데이터/AI 전문위원
○ 한국산업기술협회 빅데이터/AI 강의
○ LG CNS 빅데이터 사업팀 근무
○ KT 자회사 KTI 컨설팅 사업팀 근무
○ LG CNS 제조 시스템 개발팀 근무
<프로젝트 수행 이력>
- LG 전자 생산/자재관리 시스템 개발 및 유지보수(Oracle DBMS, PowerBuilder)
- LG 전자 Oracle ERP 시스템 구축 및 유지보수(Oracle Applications, Developer 2000)
○ 선발기준
•IT 및 빅데이터 경력자 및 관심 있는 수강생
- 1년이상 ~ 4년이하 경력자 및 빅데이터 분석 영영으로의 취업 의지를 가지고 계신분
•전공과목 : 공학계열, 이과계열, 문과계열
- 레벨테스트 : 각 과목에 대한 이해도 평가
- 면접 : 열정, 적극성, 소통, 융합
•1차 레벨테스트
- 대상: 접수 교육신청자 중 결격사유가 없는 전체
•2차 면접
- 대 상 : 1차 레벨테스트 통과자
- 선 발 일 정 : 9/18(토)~10/31(일)
- 역량 테스트 : 11/1(월)~11/5(금)
- 면 접 일 정 : 11/8(월)~11/12(금)
- 합격자 발표 : 11/15(월)
*상기 일정은 변동될수 있음
○ 교육내용
* 정형데이터 분석을 위한 Python 프로그래밍 기초
- Python의 기초 문법 이론/실습
- 프로젝트를 통한 실무 활용 기법 습득
*정형/비정형 데이터 수집/가공/처리
- 정형 데이터(DBMS, File)
- 비정형 데이터(WEB, SNS)
- 프로젝트를 통한 실무 활용 기법 습득
•빅데이터 방법론(CRISP-DM) 이해 및 단계별 Task 실행
•Business Understanding
- 비즈니스 목표 검토
- 데이터 분석 목표 수립
- (초기)가설 수립
•Data Understanding
- EDA(탐색적 분석)
- 기초 통계량
- 그래프
•Data Preparing
- 결측치 처리
- 이상치 처리
- Dummy 변수 생성
- Featuring 변수 생성
- Scaling(표준화/정규화)
- Data Split(Training/Validation/Test Data)
•Modeling
- 회귀 모델 분석
- 분류 모델 분석
- 군집 모델 분석
•Evaluation
- 모델 평가 지표 분석
- 회귀 모델 평가 지표(상관계수, 결정계수, MSE, RMSE, MAE, MPE, MAPE)
- 분류 모델 평가 지표(Confusion Matrix-Accuracy, Precision, Sensitive, Recall, F1-Score, ROC-Curve : AUC)
- 군집 모델 평가 지표(정분류율, 외부평가-분류성능평가지표, 내부평가-단순계산법, Dunn Index, Elbow Method)
•Deployment
- 프로젝트 결과물 최종 확정
- 이관을 위한 테스트
- 운영시스템에서 품질(성능 목표) 유지 기준 확정
- 운영시스템에서 모니터링 계획 수립
•시각화
- 시각화 툴 Tableu 사용
- 데이터 활용 종류별 그래프 생성
- 데이터 활용 대시보드 생성
•실무 프로젝트
- Kaggle 및 공공데이터 활용
- 빅데이터 방법론을 활용한 단계별 분석 및 산출물 작성
- 분석 결과 대시보드 제작
- 포트폴리오 작성 및 발표
위치보기 |
|
서울 금천구 가산로 70 새싹(SeSAC) 금천캠퍼스 |
[교육] 건강보험공단 DB를 활용한 헬스케어 데이터 경진대회 ...인공지능(AI) 경진대회 전문 플랫폼 데이콘이 국민건... | [채용] 이노베이션아카데미, 24 성과 공유 컨퍼런스 개최이노베이션아카데미(학장 전영표)는 12월 4일 서울 엘... | [교육] 소프트웨어정책연구소, 2025 SW산업전망 컨퍼런스 개...소프트웨어정책연구소는 12월 3일(화) 서울 코엑스 40... |