- 제목
- [모집] KOSSDA 방법론 교육 - 웹데이터를 활용한 빅데이터 분석
- 작성일
- 2021.03.22
- 작성자
- 지역학협동과정
- 게시글 내용
-
- • 담 당: 최재성 교수 (성균관대학교 글로벌경제학과)
- • 수업방식: 플립 러닝 (Flipped Learning)
- - 매주 사전 제작된 동영상 강의를 선행 학습한 후, Zoom 실시간 온라인 강의에 참여
- • 강의구성
- - 동영상 강의 (이론 중심, 2시간 분량) + Zoom 실시간 강의 (실습 및 Q&A, 2시간 진행)
- • 강의일정: 총 4회 과정
- - 사전 제작 동영상 강의 오픈 : 5월 3일, 10일, 17일, 24일 [매주 월요일, 10시경 회차별 오픈 예정]
- ※ 각 주차별 동영상 강의는 매주 월요일부터 일주일 동안 수강 가능합니다.
- - Zoom 실시간 강의 : 5월 8일, 15일, 22일, 29일 [매주 토요일, 14:00~16:00]
- ※ 매주 Zoom 실시간 강의 종료 후 24시간 동안 다시보기가 제공됩니다.
- - 사전 제작 동영상 강의 오픈 : 5월 3일, 10일, 17일, 24일 [매주 월요일, 10시경 회차별 오픈 예정]
1. 과정 개요
개요 워크숍 목표 및 개요 이 워크숍은 R을 사용해서 웹에서 데이터를 수집하고, 이렇게 수집된 다양한 형 태의 데이터를 전처리 후 분석하는능력을 갖추도록 돕는 것을 목표로 한다. 또 한 R에서 생성한 분석 결과를 이메일이나 SNS를 통해 공유하는 방법과 자료 수집 및 분석이 반복적으로 수행되도록 자동화하는 방법을 다룬다. 아울러 학술 연구에 활용할 수 있는 유용한 시각화 방법과 웹에서 수집한 데이터를 활용한 사회과학 연구들을 소개한다. 참가 대상 웹에서 자료를 수집하고 이를 활용하여 학술연구를 수행하고자 하는 학부/대학 원생 및 연구자 선수 과목 기본적인 R 프로그램에 대한 이해
- R을 사용해서 기초통계 분석이 가능하고, 조건문, 반복문, 함수를 다룰 수 있어야 합니다.워크숍 운영방식 사전 제작 동영상 강의 (관련 배경과 함수 소개 및 기초 사례 실습) + zoom 실시간 온라인 강의 (심화 사례 실습 및 Q&A) 교재 및 참고문헌 강사의 강의노트가 제공됩니다.
<참고문헌>
- 김영우. 2017. Do it! 쉽게 배우는 R 데이터 분석. 이지스퍼블리싱
- 이현열. 2021. R을 이용한 퀀트 투자 포트폴리오 만들기. 제이펍
- Rafael A. Irizarry. 2021. Introduction to Data Science (웹에 공개됨) - Hadley Wickham & Garrett Grolemund. 2021. R for Data Science (웹에 공개됨)실습자료 추후 공지 사용될 프로그램 R & RStudio (Windows10 환경에서 설명) 담당강사 정보 <학력/경력>
- 성균관대학교 글로벌경제학과 부교수 (2013~현재)
- 경제학 박사. University of Pennsylvania. 2013.
- 학술지 <노동경제논집> 편집위원 (현)
- 한국노동경제학회 학술이사 (전)
<주요 논문/저서>
- "The effect of delaying school start time on adolescents' time use and health: Evidence from a policy change in South Korea" Asian Population Studies (2021)
- "Temporal change in early labor market outcomes of young college graduates in South Korea" The Annals of the American Academy of Political and Social Science (2020)
- "학자금 대출 경험이 노동시장 초기행태에 미치는 영향" <경제분석> (2019)
- "Polarized embrace: South Korean media coverage of human rights, 1990-2016" Journal of Human Rights (2019)
- "Do single-sex schools enhance students' STEM (Science, Technology, Engineering, and Mathematics) outcomes?" Economics of Education Review (2018)
- "Learning beyond the school walls: Trends and implications" Annual Review of Sociology (2016)
- "Evaluating the effects of governmental regulations on South Korean private cram schools" Asia Pacific Journal of Education (2016)
- "학원정보 공공데이터를 활용한 서울시 사교육 공급에 관한 분석" <조사연구> (2016)
- "Separating boys and girls and increasing weight? Assessing the impacts of single-sex schools through random assignment in Seoul" Social Science & Medicine (2015)다시보기 제공여부 매주 Zoom 수업 종료 후 24시간 동안 강의영상 다시보기가 제공됩니다. 2. 강의 계획
일 시 강의 및 실습 내용 비 고 1주차 [동영상 강의]
5월 3일(월)부터 수강 가능• 빅데이터 시대의 사회과학 연구• 웹데이터를 사용한 학술 논문• Tidyverse 계열 패키지 및 주요 함수 소개 (dplyr, stringr 등)• 웹 스크래핑 기초 (1) - - 웹의 동작 방식 및 웹 스크래핑을 위한 배경 지식 소개
- - rvest 패키지를 사용한 간단한 사례 실습
[zoom]
5월 8일(토)
14:00~16:00• 분석 사례: 논문 서지 정보• 분석 사례: Google Scholar (Google이 수집을 허용하는 페이지 대상) 2주차 [동영상 강의]
5월 10일(월)부터 수강 가능• 웹 스크래핑 기초 (2) - - HTML 문법과 인코딩의 이해
- - XML과 JSON 데이터 다루기
[zoom]
5월 15일(토)
14:00~16:00• 분석 사례: 신문 기사 3주차 [동영상 강의]
5월 17일(월)부터 수강 가능• API를 이용한 데이터 수집과 분석 - - Naver 검색 API (뉴스, 블로그 등)
- - 공공데이터 포털 API (부동산 실거래가, 대기질 정보 등)
[zoom]
5월 22일(토)
14:00~16:00• 분석 사례: API를 이용한 지오코딩(위경도 좌표 변환)과 지도 시각화• 분석 사례: 로그인이 필요한 웹사이트 정보 수집 4주차 [동영상 강의]
5월 24일(월)부터 수강 가능• R Markdown - - 분석 결과가 담긴 보고서 생성하기
- - Dashboard 만들기
[zoom]
5월 29일(토)
14:00~16:00• 분석 사례: Youtube와 팟캐스트 최근 게시물 수집하기