모바일 메뉴 닫기
 

게시판

Board

제목
[모집] KOSSDA 방법론 교육 - 웹데이터를 활용한 빅데이터 분석
작성일
2021.03.22
작성자
지역학협동과정
게시글 내용
  • • 담 당: 최재성 교수 (성균관대학교 글로벌경제학과)
  • • 수업방식: 플립 러닝 (Flipped Learning)
    • - 매주 사전 제작된 동영상 강의를 선행 학습한 후, Zoom 실시간 온라인 강의에 참여
  • • 강의구성
    • - 동영상 강의 (이론 중심, 2시간 분량) + Zoom 실시간 강의 (실습 및 Q&A, 2시간 진행)
  • • 강의일정: 총 4회 과정
    • - 사전 제작 동영상 강의 오픈 : 5월 3일, 10일, 17일, 24일 [매주 월요일, 10시경 회차별 오픈 예정]
      • ※ 각 주차별 동영상 강의는 매주 월요일부터 일주일 동안 수강 가능합니다.
    • - Zoom 실시간 강의 : 5월 8일, 15일, 22일, 29일 [매주 토요일, 14:00~16:00]
      • ※ 매주 Zoom 실시간 강의 종료 후 24시간 동안 다시보기가 제공됩니다.

1. 과정 개요

개요
워크숍 목표 및 개요이 워크숍은 R을 사용해서 웹에서 데이터를 수집하고, 이렇게 수집된 다양한 형 태의 데이터를 전처리 후 분석하는능력을 갖추도록 돕는 것을 목표로 한다. 또 한 R에서 생성한 분석 결과를 이메일이나 SNS를 통해 공유하는 방법과 자료 수집 및 분석이 반복적으로 수행되도록 자동화하는 방법을 다룬다. 아울러 학술 연구에 활용할 수 있는 유용한 시각화 방법과 웹에서 수집한 데이터를 활용한 사회과학 연구들을 소개한다.
참가 대상웹에서 자료를 수집하고 이를 활용하여 학술연구를 수행하고자 하는 학부/대학 원생 및 연구자
선수 과목기본적인 R 프로그램에 대한 이해
- R을 사용해서 기초통계 분석이 가능하고, 조건문, 반복문, 함수를 다룰 수 있어야 합니다.
워크숍 운영방식사전 제작 동영상 강의 (관련 배경과 함수 소개 및 기초 사례 실습) + zoom 실시간 온라인 강의 (심화 사례 실습 및 Q&A)
교재 및 참고문헌강사의 강의노트가 제공됩니다.

<참고문헌>
- 김영우. 2017. Do it! 쉽게 배우는 R 데이터 분석. 이지스퍼블리싱
- 이현열. 2021. R을 이용한 퀀트 투자 포트폴리오 만들기. 제이펍
- Rafael A. Irizarry. 2021. Introduction to Data Science (웹에 공개됨) - Hadley Wickham & Garrett Grolemund. 2021. R for Data Science (웹에 공개됨)
실습자료추후 공지
사용될 프로그램R & RStudio (Windows10 환경에서 설명)
담당강사 정보<학력/경력>
- 성균관대학교 글로벌경제학과 부교수 (2013~현재)
- 경제학 박사. University of Pennsylvania. 2013.
- 학술지 <노동경제논집> 편집위원 (현)
- 한국노동경제학회 학술이사 (전)

<주요 논문/저서>
- "The effect of delaying school start time on adolescents' time use and health: Evidence from a policy change in South Korea" Asian Population Studies (2021)
- "Temporal change in early labor market outcomes of young college graduates in South Korea" The Annals of the American Academy of Political and Social Science (2020)
- "학자금 대출 경험이 노동시장 초기행태에 미치는 영향" <경제분석> (2019)
- "Polarized embrace: South Korean media coverage of human rights, 1990-2016" Journal of Human Rights (2019)
- "Do single-sex schools enhance students' STEM (Science, Technology, Engineering, and Mathematics) outcomes?" Economics of Education Review (2018)
- "Learning beyond the school walls: Trends and implications" Annual Review of Sociology (2016)
- "Evaluating the effects of governmental regulations on South Korean private cram schools" Asia Pacific Journal of Education (2016)
- "학원정보 공공데이터를 활용한 서울시 사교육 공급에 관한 분석" <조사연구> (2016)
- "Separating boys and girls and increasing weight? Assessing the impacts of single-sex schools through random assignment in Seoul" Social Science & Medicine (2015)
다시보기 제공여부매주 Zoom 수업 종료 후 24시간 동안 강의영상 다시보기가 제공됩니다.

 

2. 강의 계획

일 시강의 및 실습 내용비 고
1주차[동영상 강의]
5월 3일(월)부터 수강 가능
• 빅데이터 시대의 사회과학 연구• 웹데이터를 사용한 학술 논문• Tidyverse 계열 패키지 및 주요 함수 소개 (dplyr, stringr 등)• 웹 스크래핑 기초 (1)
  • - 웹의 동작 방식 및 웹 스크래핑을 위한 배경 지식 소개
  • - rvest 패키지를 사용한 간단한 사례 실습
 
[zoom]
5월 8일(토)
14:00~16:00
• 분석 사례: 논문 서지 정보• 분석 사례: Google Scholar (Google이 수집을 허용하는 페이지 대상) 
2주차[동영상 강의]
5월 10일(월)부터 수강 가능
• 웹 스크래핑 기초 (2)
  • - HTML 문법과 인코딩의 이해
  • - XML과 JSON 데이터 다루기
• 텍스트 자료 다루기 - 정규표현식(Regular expression) 기초
 
[zoom]
5월 15일(토)
14:00~16:00
• 분석 사례: 신문 기사 
3주차[동영상 강의]
5월 17일(월)부터 수강 가능
• API를 이용한 데이터 수집과 분석
  • - Naver 검색 API (뉴스, 블로그 등)
  • - 공공데이터 포털 API (부동산 실거래가, 대기질 정보 등)
• Selenium을 활용한 웹 스크래핑
 
[zoom]
5월 22일(토)
14:00~16:00
• 분석 사례: API를 이용한 지오코딩(위경도 좌표 변환)과 지도 시각화• 분석 사례: 로그인이 필요한 웹사이트 정보 수집 
4주차[동영상 강의]
5월 24일(월)부터 수강 가능
• R Markdown
  • - 분석 결과가 담긴 보고서 생성하기
  • - Dashboard 만들기
• 분석 결과 공유하기 (E-mail, 텔레그램, 클라우드 동기화 등)
 
[zoom]
5월 29일(토)
14:00~16:00
• 분석 사례: Youtube와 팟캐스트 최근 게시물 수집하기