Standardized Coefficients vs Unstandardized Coefficients

Author

Nguyễn Ngọc Bình

So sánh

Hệ số hồi quy có thể được chuẩn hóa hoặc không chuẩn hóa, và chúng có mục đích khác nhau trong phân tích thống kê. Dưới đây là sự khác biệt giữa hai loại hệ số này:

  1. Hệ số không chuẩn hóa:

    • Hệ số không chuẩn hóa (Unstandardized Coefficients), còn được gọi là hệ số góc hoặc hệ số beta, biểu thị sự thay đổi trong biến phụ thuộc (Y) khi biến độc lập (X) thay đổi một đơn vị, trong khi giữ tất cả các biến khác cố định.

    • Chúng được biểu thị trong đơn vị đo lường gốc của các biến. Ví dụ, nếu bạn đang dự đoán mức lương (bằng đô la) dựa trên số năm kinh nghiệm, hệ số không chuẩn hóa có thể là, ví dụ, 5.000 đô la, có nghĩa là với mỗi năm kinh nghiệm bổ sung, mức lương dự kiến sẽ tăng 5.000 đô la.

    • Hệ số không chuẩn hóa hữu ích khi bạn muốn hiểu về tác động thực tế của biến độc lập lên biến phụ thuộc.

  2. Hệ số chuẩn hóa:

    • Hệ số chuẩn hóa (Standardized Coefficients), còn được gọi là trọng số beta hoặc hệ số beta, là các hệ số đã được biến đổi sao cho có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1. Quá trình chuẩn hóa này cho phép so sánh trực tiếp sự quan trọng tương đối của các biến độc lập khác nhau trong một mô hình hồi quy.

    • Chúng đo lường về sự thay đổi của biến phụ thuộc theo bao nhiêu độ lệch chuẩn khi biến độc lập thay đổi một độ lệch chuẩn.

    • Hệ số chuẩn hóa đặc biệt hữu ích khi bạn muốn so sánh sự quan trọng tương đối của các biến dự đoán khác nhau trong một mô hình, đặc biệt là khi các biến được đo trên các thang đo khác nhau. Chúng giúp trả lời câu hỏi như “Biến dự đoán nào có tác động mạnh hơn đối với kết quả, bất kể đơn vị đo lường?”

Tóm lại, hệ số không chuẩn hóa hữu ích để hiểu về tác động thực tế của các biến độc lập lên biến phụ thuộc trong đơn vị gốc của chúng, trong khi hệ số chuẩn hóa hữu ích để so sánh sự quan trọng tương đối của các biến dự đoán khác nhau khi các biến đo trên các thang đo khác nhau. Sự lựa chọn giữa hai loại hệ số này phụ thuộc vào câu hỏi nghiên cứu cụ thể và mục tiêu của phân tích của bạn.

Công thức tính Standardized Coefficients

  1. Trong trường hợp hồi quy tuyến tính, công thức để tính hệ số beta chuẩn hóa ($ _{, i} $) cho biến độc lập $ X_i $ là:

    \[ \beta_{\text{std}, i} = \frac{\beta_i}{\sigma_i} \]

    • $ _{, i} $: Hệ số beta chuẩn hóa cho biến độc lập $ X_i $.

    • $ _i $: Hệ số beta không chuẩn hóa cho biến độc lập $ X_i $.

    • $ _i $: Độ lệch chuẩn (standard deviation) của biến độc lập $ X_i $.

  2. Trong trường hợp hồi quy hồi quy logistic, công thức để tính hệ số beta chuẩn hóa ($ _{, i} $) cho biến độc lập $ X_i $ là:

    \[\beta_{\text{std}, i} = \frac{\beta_i}{\sigma_i} \times \frac{\sqrt{3}}{\pi}\]

    Trong đó:

    • \(\beta_i\) là hệ số (beta) của biến dự đoán \(X_i\) trong mô hình hồi quy logistic.
    • \(\sigma_i\) là độ lệch chuẩn của biến dự đoán \(X_i\) trong tập dữ liệu huấn luyện.
    • \(\beta_{\text{std}, i}\) là hệ số beta chuẩn hóa cho biến dự đoán \(X_i\).