Phân tích dữ liệu với R, Hỏi và đáp – Nguyễn Văn Tuấn
Lời giới thiệu
Phân tích dữ liệu đã và đang trở thành một bộ môn khoa học được rất P nhiều người trong giới nghiên cứu khoa học quan tâm. Trong thời đại Dữ liệu Lớn (Big Data) và dữ liệu đa chiều, việc khai thác và chuyển hoá dữ liệu thành thông tin, và từ thông tin thành kiến thức là một trong những qui trình cốt yếu của hoạt động khoa học. Trong quá trình chuyển hoá từ dữ liệu sang thông tin, việc ứng dụng đúng các phương pháp phân tích là một sự lựa chọn rất quan trọng. Cuốn sách Phân tích dữ liệu với R – Hỏi và Đáp bạn đang cầm trên tay sẽ giúp các bạn lựa chọn các phương pháp thích hợp cho phân tích dữ liệu, và giúp cho các bạn biến dữ liệu thành thông tin có ích.
Trong quá trình soạn cuốn sách, tôi suy nghĩ nhiều về mô hình chuyển tải các phương pháp phân tích, và cuối cùng đi đến quyết định dùng mô hình “văn đáp”. Nói cách khác, cuốn sách là một tập hợp những câu hỏi và câu trả lời cụ thể cho những vấn đề mà giới nghiên cứu khoa học thực nghiệm thường gặp phải. Có tất cả 110 câu hỏi và trả lời. Qua kinh nghiệm nghiên cứu thực nghiệm của tôi và những tương tác với rất nhiều đồng nghiệp trong quá khứ, tôi nghĩ rằng đây là hình thức gần gũi nhất và thiết thực nhất để học vẽ phân tích dữ liệu.
Nội dung cuốn sách xoay quanh các vấn đề mà giới nghiên cứu hay gặp hàng ngày. Đó là những vấn đề liên quan đến mô tả dữ liệu, kiểm định giả thuyết, phân tích liên quan, và phân tích tiên lượng. Từ phân tích mô tả, mô hình hồi qui tuyến tỉnh, mô hình hồi qui logistic, mô hình Cox, phân tích sống còn, phân tích đa biến, đến ước tính cỡ mẫu đều được trình bày từ những nghiên cứu thực tế. Tôi còn dành một nội dung khá lớn cho các phương pháp phân tích bảng biểu đỗ. Mỗi chủ đề sẽ được trình bày qua một số câu hỏi và kèm theo phương pháp giải quyết. Do mục tiêu của cuốn sách, tôi không trình bày những lí thuyết đằng sau những phương pháp, mà chỉ bàn sơ qua những thông tin chính đằng sau mỗi phương pháp. Do đó, cuốn sách cũng có thể xem là một bổ sung cho những khóa học và sách giáo khoa về lí thuyết phân tích thống kê.