Sử dụng ngôn ngữ R trong khai phá dữ liệu
Abstract
Ngôn ngữ R trong thời gian gần đây đang được quan tâm và sử dụng rộng rãi trong mọi lĩnh vực đặc biệt là các lĩnh vực phân tích, thống kê dữ liệu. Trên toàn cầu đã có một mạng lưới gần một triệu người sử dụng R và con số này đang tăng theo cấp số nhân. Đặc biệt, R được sử dụng trong khai phá dữ liệu với tập dữ liệu lớn. Theo khảo sát hàng năm của tổ chức Rexer's Annual Data Miner Survey năm 2010, tỷ lệ R được sử dụng trong khai phá dữ liệu là 43%. Theo dự đoán, trong khoảng 10 năm nữa, R sẽ được sử dụng để thay thế các phân mềm thống kê đắt tiền như SAS, SPSS hay Stats. Và hiện nay, hệ quản trị CSDL Oracle đã tích hợp R trong gói Big Data Appliance đã công bố vào tháng 10/2011.Vì vậy, Trong bài báo cáo này, nhóm tác giả sẽ tập trung chủ yếu giới thiệu sức mạnh của R trong việc phân tích, thống kê dữ liệu và giới thiệu một số công việc khai phá dữ liệu sử dụng R.
Collections
- Bài báo khoa học [148]