Data Science and Quantitative Analysis
Diễn dàn dành cho các bạn yêu thích khoa học dữ liệu (Data Science) và học máy (M
Thân gửi các bạn học viên của khóa học Khoa Học Dữ Liệu.
Việc làm sạch dữ liệu, biến đổi dữ liệu, chiết xuất (trích dữ liệu) .. trong khoa học dữ liệu được gọi là Data Manipulation hoặc Data Wrangling. Có lẽ nói không phóng đại khi nói rằng từ 50 đến 80% thời gian được tiêu tốn cho việc này và đương nhiên nó là một khâu không thể thiếu và luôn xuất hiện ngay ở đầu bất cứ dự án nào.
Với 36000 quan sát đến từ 5 quốc gia làm thế nào các bạn tính ra được, ví dụ, những thống kê đơn giản như trung bình? sai số chuẩn cho điểm toán theo từng quốc gia?
Để thành thạo các kĩ năng này, trước hết các bạn theo dõi loạt bài sau (theo thứ tự):
1. Cơ bản về data manipulation với hệ sinh thái (hay gói) tidyverse:
http://rpubs.com/chidungkt/234283
2. Về sử dụng toán tử hút thuốc:
http://rpubs.com/chidungkt/234438
3. Về thực hành với bộ số liệu PISA:
http://rpubs.com/chidungkt/236088
http://rpubs.com/chidungkt/239958
4. Về sử dụng gói DT trình bày bảng biểu:
http://rpubs.com/chidungkt/233830
09/01/2017
R code cho Artificial Neural Network (khóa học khoa học dữ liệu và Machine Learning).
Thân gửi các bạn học viên tham dự lớp học về khoa học dữ liệu và Machine Learning.
Machine Learning (ML) vốn là môn học được tạo ra do sự kết hôn của thống kê và khoa học máy tính. Với người chưa từng biết về ML trước đó, thì sẽ gặp nhiều khái niệm mới và có thể sẽ có chút lúng túng. Nhất là những thứ như lập trình.
Một trong những rắc rối của ML là chi tiết sau (chỉ đơn thuần là mặt kĩ thuật thôi): các code thường rất dài (và gõ cần phải chính xác). Do vậy, mình gửi trước các bạn code để các bạn chuẩn bị.
http://rpubs.com/chidungkt/240558
Data wrangling với bộ dữ liệu PISA:
http://rpubs.com/chidungkt/238185
Click here to claim your Sponsored Listing.
Category
Contact the school
Telephone
Website
Address
Hanoi
100000