Giới thiệu
Giới thiệu về tôi
Trong trang web này, tôi sẽ chia sẻ những dự án và tài liệu liên quan đến các chủ đề như:
- Học máy (Machine Learning)
- Thống kê (Statistics)
Tôi cũng rất quan tâm đến việc xây dựng các tài liệu dễ chia sẻ và có thể tái sử dụng, giúp cộng đồng dễ dàng áp dụng trong công việc của mình.
Các nội dung chính
Dưới đây là các chủ đề mà tôi đã thực hiện và chia sẻ:
1. Học máy (Machine Learning)
Tôi đã thực hiện nhiều nghiên cứu và dự án liên quan đến học máy, bao gồm các chủ đề như:
- Focal Loss: Cải thiện hiệu suất cho các mô hình phân loại mất cân bằng.
- Delong Test: Phương pháp so sánh đường cong ROC giữa các mô hình khác nhau.
- Permutation Feature Importance: Phân tích tầm quan trọng của các đặc trưng trong mô hình.
- SHAP: Giải thích các dự đoán của mô hình bằng phương pháp SHAP (SHapley Additive exPlanations).
- Model Calibration: Điều chỉnh xác suất dự đoán của mô hình.
- Reinforcement Learning: Ứng dụng học tăng cường để tối ưu hóa mô hình.
2. Thống kê (Statistics)
Một số nội dung tôi đã làm về thống kê bao gồm:
- Confidence Interval with Small Sample Size: Tính toán khoảng tin cậy cho mẫu dữ liệu nhỏ.
- PSI, KS, Entropy: Các phương pháp đánh giá sự khác biệt trong phân phối.
- Difference-in-Differences (DiD): Phương pháp để ước lượng ảnh hưởng của một sự can thiệp.
- Monte Carlo và Bootstrap: Kỹ thuật lấy mẫu để ước lượng thống kê.
Thông tin thêm
Thông tin về các source code (github hoặc gitlab):
- Trang web cá nhân (same link for gitlab)
- GitHub (same link for gitlab)