Hướng dẫn cở bản khi sử dụng ngôn ngữ R cho người mới

27/07/2020 2.075 lượt xem

 
Đây là bài hướng dẫn không dành cho những người đã thành thạo ngôn ngữ R, chúng tôi chỉ hướng dẫn cho bạn cách để bắt đầu dùng ngôn ngữ R làm việc với dữ liệu cơ bản: giải nén các thống kê của một tập dữ liệu, khám phá một tập dữ liệu với những biểu đồ cơ bản, và định hình lại dữ liệu để dễ dàng hơn trong việc phân tích các dữ liệu.
 
Bước đầu tiên,
 
Để bắt đầu sử dụng ngôn ngữ R, truy cập r-project.org để dowload và cài đặt cho desktop hay laptop của bạn. Nó chạy trên môi trường Windows, OS X, và một loạt những nền tảng của Unix, nhưng không thể chạy trên Android hay iOS.
Cài đặt ngôn ngữ R là đều đầu tiên bạn phải làm. Tuy nhiên,  Tôi đề nghị cài đặt ngôn ngữ R IDE RStudio miễn phí. R có những tính năng hữu ích mà bạn sẽ mong đợi từ một nền tảng mã hóa; chẳng hạn như cú pháp highlight và tab được dùng trong mã hóa auto-completion. Tôi thích không gian làm việc với 4 cửa sổ, quản lý tốt hơn nhiều cửa sổ R để gõ lệnh, lưu trữ sript hiển thị lịch sử các dòng lệnh , hiển thị trực quan và còn nhiều ưu điểm khác.
Mặc dù bạn không cần có RStudio IDE miễn phí để bắt đầu, cũng giúp cho việc làm việc với R dễ dàng hơn.
Cửa sổ góc trên bên trái là nơi làm việc chính của bạn. Đó là trình biên dịch ngôn ngữ R cho phép bạn tạo một file với nhiều dòng lệnh của ngôn ngữ R, hay mở một tâp tin đang tồn tại- sau đó chạy toàn bộ một tập tin hay những thành phần của tập tin.
Cửa sổ dưới bên trái là giao diện điều khiển tương tác, nơi bạn có thể nhập các câu lệnh của R một dòng tại một thời điểm. Bất kì những dòng code nào chạy trên cửa sổ biên dịch cũng sẽ xuất hiện trên giao diện điều khiển (console).
Cửa sổ góc trên bên phải hiển thị không gian làm việc, gồm một danh sách các object hiện tại trong bộ nhớ. Cũng có một tab hiển thị lịch sử với một danh sách các lệnh trước của bạn: bạn có thể chọn một hoặc một số hay tất cả các dòng code, bằng một click để gởi chúng đến ,hoặc giao diện điều khiển (console) hoặc là bất cứ tập tin nào
đang hoạt động trên trình biên dịch của bạn.
Cửa sổ góc dưới bên phải hiển thị một biểu đồ, nếu bạn tạo một sự trực quan dữ liệu mã hóa bằng ngôn ngữ R. Hiển thị lịch sử của các biểu đồ trước và một sự lựa chọn để xuất ra một biểu đồ dưới dạng một file hình hoặc định dạng PDF.  Đây cũng là một cửa sổ hiển thị những gói mở rộng(những phần mở rộng của R) có sẵn trong hệ thống của bạn, những tập tin trong thư mục làm việc của bạn và hiển thị các tập tin được gọi từ giao diện điều khiển.
 
Các phím tắt:
 
Phím Tab: là một chức năng tự động hoàn tất chung. Nếu bạn bắt đầu nhập dữ liệu trong giao diện điều khiển (console) hay trình biên dịch thì hãy nhấn phím Tab, RStudio đơn giản nếu bạn chọn một chức năng hoặc một tập tin mà bạn muốn,rồi nhấn giữ hoặc phím Tab hoặc Enter để chấp nhận chúng RStudio sẽ tự động làm việc.
Ctrl+ Mũi tên lên (Cmd+ Mũi tên lên trên MAC) cũng là một dụng cụ tự động hoàn thành tương tự. Bắt đầu nhập dữ liệu và giữ tổ hợp phím này, sẽ hiển thị một danh sách mỗi dòng lệnh mà đã nhập với tổ hợp phím này. Chọn và nhấn Return. Cách làm này chỉ có hiệu lực với giao diện điều khiển tương tác và không có tác dụng trong cửa sổ trình biên dịch.
 
Ctrl+ Enter (Cmd+ Enter trên MAC) hiển thị dòng code hiện tại trong trình biên dịch, và gởi chúng đến trình điều khiển. Nếu bạn chọn nhiều dòng code trong trình biên dịch và sau đó nhấn Ctrl/Cmd+ Enter, những dòng lệnh đó sẽ chạy.
Vẫn còn nhiều chức năng trong RStudio bao gồm một danh sách đầy đủ các phím trên tài liệu trực tuyến: http://www.rstudio.com/ide/docs/
 
Cài đặt thư mục làm việc:
Thay đổi thư mục đang làm việc với chức năng : setwd(), chẳng hạn:
setwd(“~/mydirectory”)
Chú ý: những dấu gạch chéo luôn luôn phải được đặt phía trước, ngay cả khi bạn đang trên một hệ thống Windows. Trong Windows, dòng lệnh như sau:
setwd(“C:/Sharon/Documents/RProjects”)
Nếu bạn sử dụng RStudio cũng có thể thay đổi thư mục làm việc bằng cách: Session > Set Working Directory.
 
Cài đặt và sử dụng:
Bạn có cơ hội được làm việc một cách dễ dàng bất cứ điều gì bằng ngôn ngữ R, nếu bạn biết tận dụng những lợi thế sẵn có trong ngôn ngữ R với hàng ngàn gói add-on ở CRAN (Comprehensive R Archive Network). Cú pháp lệnh để cài đặt gói là :
install.packages(“thepackagename”)
Nếu bạn không muốn gõ lệnh , trong RStudio có một tab Packages trong cửa sổ dưới bên phải, click vào, xuất hiện button “Install Packages.”( Cũng có danh sách những dòng lệnh, nhiều vị trí đa dạng phụ thuộc vào hệ điều hành của bạn).
Để nhìn thấy các packages đã cài đặt vào hệ thống, bạn gõ:
 installed.packages()
Hay trong RStudio, tab ‘Packages’ trong cửa sổ bên dưới.
Sử dụng một packages đã được cài đặt:
          library(“thepackagename”).
Nếu muốn hiển thị ngày cài đặt của những package, bạn chạy câu lệnh:
update.packages()
Bằng cách này , bạn có thể biết được phiên bản làm việc với nhất mà các package đã được cài đặt.
Nếu muốn xóa một package trong hệ thống, sử dụng chức năng:
remove.packages(“thepackagename”)
 
Help!
Nếu muốn tìm ra nhiều hơn một chức năng, bạn có thể gõ dấu hỏi kèm theo tên chức năng, có hoặc không trong dấu ngoặc đơn trong ngôn ngữ R:
?functionName
Đây là phím tắt của chức năng help có sử dụng dấu ngoặc:
help(functionName)
Tuy nhiên, tôi không chắc tại sao bạn lại muốn dùng nó với lệnh ?functionName ngắn hơn.
Nếu bạn biết những gì mà một chức năng dùng để làm gì hay chỉ muốn những định dạng để dùng nó đúng, bạn có thể gõ:
example(functionName)
Bạn cũng có thể lấy một danh sách các ví dụ  của chức năng được dùng. Với chức năng của đối số (arg) sẽ hiển thị một danh sách chức năng của các đối số:
args(functionName)
Nếu bạn muốn tìm kiếm một thuật ngữ trong tài liệu giúp đỡ của ngôn ngữ R, có thể dùng:
help.search(“your search term”)
Phím tắt : ??(“my search term”)
 
Không cần dấu ngoặc  nếu thuật ngữ tìm kiếm là từ đơn không có dấu cách
 
Hy vọng qua bài viết này các bạn có thể hiểu cơ bản cách sử dụng phần mềm R