공부/16산학프로젝트
[16산학프로젝트/Python]3주차
데이글로
2017. 2. 21. 13:19
이제는 실제로 주어진 데이터를 정제하는 과정이다.
csv 파일에 고객의 문의 사항에 대한 상담원분들의 답변을 HTML태그를 포함하여 긁어온 내용들이 저장되어있다.
그러면 이제 내가 공부해야할 것들은 이럴 것 같다.
1. HTML의 대략적인 구조
2. HTML 태그들을 제거하는 방법(Using Python)
3. 제거한 나머지 알맹이 내용들을 data.csv의 '2행'에 저장하는 방법
4. csv 파일에서 특정 열 또는 행의 데이터들만을 읽거나 쓰는 방법(3번 내용과 비슷)