R – MỘT TÌNH YÊU VÀ MỘT TRĂN TRỞ?

 

***

Mita viết bài này vì Mita có tình yêu, một sự cảm kích, trân trọng, biết ơn với R và một trăn trở là liệu có thể làm cho các bạn VN yêu R như Mita không? Bạn bè FB của Mita có khoảng 200 bạn, một nửa trong số đó là gia đình lớn nhỏ, một nửa còn lại là một số Thầy cô giáo yêu quý cấp 2, vài bạn cấp 2, 3, vài bạn thân, vài học trò đại học, vài đồng nghiệp, và một số bệnh nhân yêu quý, hic.

***

R là gì?

R xuất hiện đầu tiên vào 8/1993 sau Python 2 năm; là một ngôn ngữ lập trình, môi trường phần mềm dành cho tính toán và đồ họa thống kê. Một bản hiện thực ngôn ngữ lập trình S lấy cảm hứng từ Scheme (Theo R Core Team).

R dùng để phân tích dữ liệu (dữ liệu bình thường hay big data oki hết) và để phân tích thống kê; có thể sử dụng để triển khai, sản xuất ra mô hình (không siêu như python). Bạn dễ dàng sử dụng những thư viện sẵn có (library, package).

***
Câu chuyện Mita và R

Mùa thu năm 2007, Mita được biết đến R. Nhưng hơn một năm sau Mita mới thực sự bắt đầu mò mẫm tự học. Mita đến với R vì R mã nguồn mở, mỗi lần xuất bản một công bố khoa học không cần phải chứng minh mua bán bản quyền bất kỳ phần mềm xử lý dữ diệu, phân tích dữ liệu nào cả.

Thời gian đầu tiên Mita dùng R chỉ để phân tích thống kê và đồ họa thống kê, phần này bạn có thể dùng Minitab, SPSS, MaxStat, WizardMac, AcaStat, NCSS, Statwing, XL Stat, Stata, SAS, MATLAB, JMP hay Prism GraphPad, Excel … cũng giải quyết được trong giới hạn mỗi món ăn chơi khác nhau nhưng mức độ chuyên nghiệp và tốc độ không bằng R. Nhưng thời điểm đó, Mita chỉ biết là R miễn phí đơn giản thế thôi.

Những ngày đầu tiên đến với R thì Mita đọc tài liệu của Giáo sư Nguyễn Văn Tuấn – giáo sư nổi tiếng về loãng xương ở Úc. Những bài học sơ khai bằng tiếng Việt đầu tiên, học lõm bõm vất vã lắm (Giáo sư viết về R cũng bằng kinh nghiệm của một người tự học). Việc học lõm bõm này trầy trật và vất vã trong khoảng 8-9 năm đấy, mọi thứ chỉ bắt đầu từ những câu hỏi và nỗ lực tìm câu trả lời thế thôi. Mãi đến đầu năm 2017, Mita mới tìm thấy thật sự một lộ trình đơn giản, hiệu quả, không lõm bõm và tự tin giúp đỡ cho người mới đến với R.

Mita sử dụng R để tạo ra những đồ thị trong các công bố khoa học của mình, thật sự long lanh, thật sự đơn giản, dễ hiểu; Mita tạo ra những mô hình tối ưu hóa; và cùng phát triển thành gói dữ liệu (package, library) riêng với anh bạn người Đan Mạch. (Hình ảnh bên dưới được tạo ra từ R).

Người đầu tiên học R từ Mita là một cô gái Thái Lan – học trò của một giáo sư trường Penn State, sau đó là hai bạn người Thái trường Chulalongkorn (sau đó cả hai đều bỏ cuộc), tiếp là bạn người Nhật – hiện tại đang làm nghiên cứu sinh ở California (Mỹ), rồi đến hai bạn Mỹ trường Ohio State, sau đó khoảng 5-7 bạn Đài Loan và Ấn Độ. Thi thoảng Mita trở thành cô giáo bất đắc dĩ cho nhóm người Ấn Độ học R thông qua mạng (thường hướng dẫn của mình kéo dài chưa đầy 30 giây và các bạn ấy phải học ít nhất 6 tháng để thấm, và nỗ lực sau đó để biến hóa trong lĩnh vực của các bạn). Khoảng những năm 2012 – 2014 Mita có giới thiệu về R cho đồng nghiệp và sinh viên VN nhưng mọi người ai cũng lắc đầu không tiếp cận.

***
Tại sao R không dễ đón nhận?

Tìm kiếm nguồn tiếng Việt hoặc tiếng Anh để học R cũng rất chi làm lõm bõm, Mita có cảm tưởng các blog viết về R trên mạng hiện nay cũng bắt đầu từ việc đặt câu hỏi và tìm câu trả lời mang tính cá nhân VÀ DỊCH TỪ BÀI VIẾT TIẾNG ANH SANG TIẾNG VIỆT ĐỂ VIẾT BLOG (như một nghề). Đây là cái khó khăn đầy tiên mà mọi người không thể bước qua được để đến một bầu trời tuyệt đẹp đang chờ phía trước.

R như đã nói là một ngôn ngữ lập trình, có nghĩa bắt đầu không có gì cả ngoài cái màn hình trống trơn với khối dữ liệu khổng lồ (big data, không thể mở bằng excel hay matlab gì được cả), tất cả còn lại ở trong đầu của bạn. Một cái khó tiếp theo bạn không thể vượt qua để đến bầu trời tuyệt đẹp phía trước.

Không có Thầy chỉ đường, không có hướng đi đương nhiên là khó và dễ dàng bỏ cuộc. Nhưng R cho bạn nét riêng hiếm có.

Airn.CpG_island.2

***
R cho bạn nét riêng hiếm có

Khi mình làm việc với Dr. Pearly (giáo sư Ohio State, nhóm phát triển package dùng phân tích tất tần tận về methylation, một đặc điểm biến đổi biểu sinh ở gene – dấu hiệu của bệnh, tuổi tác, di truyền, chủ yếu là ung thư), câu đầu tiên bà hỏi mình có biết R không? Rồi sau đó, rất nhiều giáo sư Đài, Sin, Nhật, Thụy Điển, Mỹ biết mình, đều nhờ vã mình hỗ trợ phân tích và tạo ra những biểu đồ đẹp long lanh, đơn giản, dễ hiểu để làm say đắm các nhà đánh giá sản phẩm khoa học (reviewers, editors) ngay lần đầu tiên mà không nỡ đánh dấu từ chối công bố (reject). Thật sự riêng phải không?

Khi Mita ngồi đăm đăm chiêu chiêu gõ những dòng code R trên máy tính bên trái và kết quả chạy ra trên màn hình máy tính bên phải, đôi khi mò mẫm thông tin với màn hình máy tính ở giữa thì mọi người ở phòng nghiên cứu dù cũ dù mới đều ồ à thú vị phếch đấy.Rất riêng phải không?

Khi Mita biết R vừa đủ (hiện nay vẫn chưa thấy mình vững vàng chắc chắn gì cả) thì sếp (boss) và bạn của sếp đều cố níu cố kéo cố giữ cố deal để Mita đồng hành cùng. Nét riêng phải không?

***
Liệu R có dành riêng cho nghiên cứu y học không?

Không hề. R dành cho mọi người, cho kinh tế, cho xã hội, cho y học, cho kỹ thuật, cho mọi khoa học. Mình đã từng hỗ trợ cho bạn làm nghiên cứu sinh về tâm lý giáo dục học ở Pháp, và bạn làm nghiên cứu sinh tài chính học ở Hàn và một vài giáo sư ngành kinh tế và xã hội phân tích dữ liệu và tạo ra những đồ thị long lanh.

***
Liệu R có thể phát triển thành một nghề kiếm tiền không?

Hoàn toàn có thể. Bạn ở bất kỳ đâu người thuê bạn cũng cần bạn cả nếu bạn có thể giải quyết câu hỏi họ đặt ra. Và đương nhiên tiền sẽ chạy về ví của bạn. Hì hì

***
Tại sao R không phổ biến so với Python?

Cả R và Python trong giới chuyên môn đánh giá là rất xa xỉ nhưng không dễ cho mọi người. Riêng mảng bắt đầu với R thì không hề đơn giản như Python. Python cũng có nhiều đặc biệt nổi trội. Cả hai bạn R và Python đang là xu hướng của thời đại, khả năng kiếm việc với mức lương ngất ngưỡng tăng lên hàng năm nhờ bạn có nét riêng này.

***
Tốn bao lâu để bạn có thể vững vàng về R?

Mita đã tốn gần 10 năm để biết vừa đủ chứ chưa thật sự vững vàng, là do Mita không có người dẫn đường, Mita không hề biết một chút ngôn ngữ lập trình trước đó, chưa từng ngồi lớp học bất kỳ chữ nào về công nghệ thông tin, và chỉ code khi có câu hỏi cần trả lời chứ không code liên tục. Hiện nay, bạn có thể tốn 6 tháng đến 1 năm bạn thật sự vững vàng và siêu giỏi. Riêng với các bạn đã biết nhiều về lập trình, về thông tin có thể tốn vài tuần đến vài tháng.

#mitatran

Lời cuối

Mita – yêu R và vẫn luôn trăn trở ‘liệu R có thể phổ rộng hơn cho sinh viên, cán bộ nghiên cứu, nhà khoa học Việt Nam không?’ Và nếu bạn đang loay hoay chưa biết tương lai về đâu, hãy bỏ lại tất cả và bắt đầu với R như một nghề.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

The maximum upload file size: 10 MB. You can upload: image, audio, video, document, spreadsheet, interactive, text, other. Links to YouTube, Facebook, Twitter and other services inserted in the comment text will be automatically embedded. Drop files here