Bài giảng 29: giới thiệu phân tích tương quan và cách tính hệ số tương quan bằng R
Nguồn: https://sylvaniachristian.com/
Xem thêm bài viết: https://sylvaniachristian.com/category/cong-nghe

Bài giảng 29: giới thiệu phân tích tương quan và cách tính hệ số tương quan bằng R
Nguồn: https://sylvaniachristian.com/
Xem thêm bài viết: https://sylvaniachristian.com/category/cong-nghe
Thưa thầy, em muốn tìm tài liệu slide của thầy để học thì phải lấy ở đâu ạ?
Cảm ơn thầy.
Cảm ơn Thầy nhiều!
Cảm ơn thầy nhiều. Series bài giảng rất hay và có nhiều ngoại truyện. Chúc thầy sức khỏe.
Em cũng nghĩ như ông Galton ở mấy dòng trích dẫn dù không thôgn minh hay mất công nghiên cứu như ông ta :)))
thầy giảng kỹ và rất thân thiện 🙂
Rất hữu ích ạ, em cảm ơn thầy !!
Cam on Thay vi bai giang hay, ro rang va day y nghia.
BAi giang rat hay va de hieu Thay a. Con cam on Thay.
Cam on thay nhieu a
em đã đọc sách của thày ạ. Tự sự của người làm khoa học
em cảm ơn thầy rất nhiều ạ !
Cảm ơn thầy vì những bài giảng mà thầy đã chia sẻ. Em đã đỡ sợ môn Statistics rồi ạ. Chúc thầy luôn mạnh khỏe và công tác tốt 🙂
Chào thầy ! Em nhập code này vào R de tinh he số tương quan nhưng sao báo lỗi như sau a "
Số liệu em lưu trong : "D:\Data\"
Tên file csv : ffdata
Nội dung trong file các cột
Date Rm-Rf SMB HML Rf Ri Ri-Rf
Và đây là code chạy mô hình
# Load CSV file into R
loadPath = "D:\Data\"
ff_data <- read.table(loadPath,"ffdata.csv",header=TRUE,sep=",")
ff_data = read.csv(file=paste(loadPath, "ffdata.csv", sep=""),
header=TRUE, stringsAsFactors=FALSE)
# Extract Fama-French Factors
rmrf <- ff_data[,2]
smb <- ff_data[,3]
hml <- ff_data[,4]
rf <- ff_data[,5]
rirf <- ff_data[,7]
# Calculate Excess Returns for Target fund
rirf <- ri – rf
# Run Fama-French Regression
ffregression <- lm(rirf ~ rmrf + smb + hml)
# Print summary of regression results
print(summary(ffregression))
*******************************************************
Em nhập thêm code kiểm định tương quan mà không được ạ, voi code sau. Dữ liệu không có missing
> cor (rirf,rmrf)
Báo lỗi như sau
Error in is.data.frame(x) : object rirf not found.
Thầy có thể hướng dẫn em nhập thêm code nào để đưa rjrf vào không ạ
Thầy giảng dễ hiểu quá! chúc thầy có nhiều sức khỏe để có nhiều bài giảng hay như thế này!
Dạ em chào thầy!
Thầy ơi, thầy cho em hỏi là em đọc dữ liệu từ file excel, trong file này có những giá trị trống nên em đặt là #N/A vậy khi em muốn tính hệ số tương quan trong R thì có ảnh hưởng gì không ạ? và có thể loại những giá trị đó ra khỏi tính toán của mình ko ạ?
Và khi em tính hệ số tương quan bằng hàm cor(x,y) thì nó báo lỗi như sau:
> cor(GDP,POP)
Error in cor(GDP, POP) : 'x' must be numeric
Em mới dùng R từ khi xem video thầy dạy nên em chưa hiểu rõ lắm, em đã lên các forum xem và thấy rằng do giá trị trong dữ liệu của em không phải là giá trị số. Vậy có cách nào sửa không thầy?
Em cảm ơn thầy ạ, chúc thầy luôn mạnh khỏe!
em cam on thay rat nhieu a! chuc thay luon an vui va manh khoe
Em cảm ơn thầy! Thầy đã cứu môn Statistics của em! Hihi tưởng bị mất gốc luôn roài! Cảm ơn thầy nhiều lắm ạ! Thầy thật vui tính trong những bài giảng của mình! Sẽ học hỏi cả cách giảng của thầy nữa ạ.
chú ơi, cháu có một ví dụ muốn hỏi chú:
Giả sử ta làm một n/cứu tìm ra y/tố nguy cơ gây đẻ non trong đó có cả biến continue: tuổi mẹ, BMI… và biến discret:hút thuốc, tiền sử đẻ non, nạo thai….
Ta có thể test từng biến một, với biến continue thì dùng t.test; wilcox.test với v.discrete thì dùng chi-2, prop.test, cor.test… Nhưng như vậy rất lâu !
Cháu muốn hỏi cách nào làm nhanh và đơn giản nhất trong trường hợp này ạ?
có thể tính OR đa biến, bao gồm cả biến continue & binary được ko ạ?