일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 대학교재
- Algorithm
- 혼공씨
- 문제해결
- 코딩연습
- 빅데이터
- c언어문제풀이
- 연습문제
- 혼공C
- 도전실전예제
- Python
- 코딩
- C언어
- 데이터처리
- 코딩테스트
- 코틀린
- 모두를위한 R데이터분석
- 알고리즘
- 초보
- 모두를위한R데이터분석입문
- 빅데이터입문
- r
- 기술
- IT
- PrimePath
- 대학교재풀이
- 소수경로
- 혼자공부하는C언어
- c++
- c프로그래밍
- Today
- Total
목록빅데이터입문 (9)
Jupitor's Blog
drive.google.com/drive/folders/1uxZqPt_gzB5vdGSYTbvPFhtGSjPHNgnT?usp=sharing R - Google Drive이 폴더에 파일이 없습니다.이 폴더에 파일을 추가하려면 로그인하세요.drive.google.com 모든 장의 문제에 대한 해답입니다. 참고로 읽기 암호 쓰기 암호 따로 설정해두었습니다.읽기 암호 안에 같이 있고, 읽기암호 입력하시면 쓰기 암호 입력하라고 나오는데 읽기전용으로 여시면 됩니다. 이 곳 아닌 곳에서 배포시 제가 클레임 걸테니까따로 배포는 하지 말아주세요.
제가 이것저것 문제를 풀어본 것에 댓글이 많이 올라오는데... 또 추가적으로 질문이 올라와서요. ehdrh789.tistory.com/11#comment12322428 이 글에서도 5번문제를 풀어달라는 댓글이 많이 나오는데 제가 5번 문제만 풀어서 글에 올리는게 좋으신가요, 아니면 해당 장 전체를 제가 말로 설명한 동영상을 유튜브 이런데에 찍어서 올리기를 원하시나요? 단순히 해당 글의 저 문제 뿐만 아니라 다른 장도 궁금하네요. 제가 여유만 된다면 여러분들이 원하시는 부분을 말로 설명해서 유튜브에 올릴 수 있습니다. 제가 말로 설명을 또 괜찮게 하는 편이라서요. 여러분의 의견이 궁금합니다. 댓글로 달아주시면 감사하겠습니다.
이번 장은 데이터 시각화에 관한 파트입니다. 데이터를 한눈에 보기 쉽게 만들 수 있는 굉장히 중요한 부분이죠. 아마 많은 분들이 관심이 있으실거라고 생각합니다. 뭐 이렇게 말해봤자 책이 없는한 이 포스트를 보는 의미가 없죠 ^.^; 제가 그 내용을 뭐 가르쳐드리는 것도 아니고. 단지 이런 결과물이 나온다, 정도로만 봐주시면 좋을 것 같습니다. 문1. 문2. 문3. 문4. 문5. 모자이크플롯을 살펴보면 눈색깔이 갈색이면서 머리색깔이 블랙인 인구가 머리색깔이 검정색이고 다른 눈 색깔을 가지고 있는 사람들의 수보다 훨씬 많은 것을 알 수 있습니다. 즉 머리 색깔이 검정색인 사람들 중에서 갈색 눈동자를 가진 사람이 절반이 넘는다는 것이죠. 문7. 문8. 문9. 문10. 문11. 문12. 문15. 마찬가지로 틀린..
aggregate 함수의 by가 굉장히 이해가 안가는군요. 다음은 help에 aggregate에 대해 검색했을때 나오는 예문입니다. 이게 그 결과문이구요. 현재 저로써는 이해가 안가네요; by에 쓰이는 list가 testDF 내에 있는 열이 아닙니다. 그렇다면 도대체 어떤 방식으로 뽑는건지... 누가 저 좀 댓글로 설명 좀 해주세요 ㅠ.ㅠ 문1. 문2. 문3. 문4. 문5. 문6. 문8. 문9. 문10. 문11. 문12. 문13. 문15. 14번 문제의 경우 굉장히 이해가 안가더군요. 소괄호 2번 문제에서 역 이름과 날짜별로 인원을 집계하라고 나와있는데 역 이름은 깨지고, 뭐 이건 그렇다 치고 데이터 자체가 일별 탑승인원과 하차인원이 나와있는데 이걸 날짜별로 '집계'하라...? 집계 하라는 말에서 agg..
쉬워서 그런지 역시 하다보면 재밌는게 R인거 같네요. 이번장은 6장입니다. 마찬가지로 이전 문제와 너무 똑같거나 너무 반복이다 거나 싶은것들은 제쳐두고 풀었습니다. 수정이 필요한 부분이 있다면 댓글로 달아주세요~! 문1. 두 변수의 상관관계를 알려주는 cor 지수의 절대값이 0.5 이상이므로 두 변수 spee와 dist의 상관관계는 높다고 볼 수 있겠습니다. (책에 cor지수가 0.5 이상일 경우 상관관계를 인정할 수 있다고 나와있네요) 문2. cor지수가 0.7544923으로 높습니다. 위와 마찬가지로 상관관계가 높다고 볼 수 있겠네요. 문3. 보통 x,y 그래프에서 산포도의 형태가 대각선을 그릴 경우 상관관계가 높다고 볼 수 있겠습니다. 그나마 Income과 Illiteracy(문맹률) 변수간의 상관..
-->plot이 너무 많을 경우, 한번에 삭제하기 : dev.off(dev.list()["RStudioGD"]) 문1. 문2. 문3. 문4. 문5. 반복되는 문제가 많아 귀찮아서 다 안했습니다 -_- 틀린 것이 있다면 언제든 댓글 달아주세요~