MÔ HÌNH C-ViDNet HỖ TRỢ PHÁT HIỆN BẠO LỰC TRONG HỌC ĐƯỜNG

Tạ Công Phi , Nguyễn Viết Hưng , Lê Tấn Lộc , Ngô Quang Khánh , Trần Thanh Nhã

Nội dung chính của bài viết

Tóm tắt

Bạo lực học đường là một vấn đề phức tạp và đáng lo ngại trong hệ thống giáo dục của nhiều quốc gia trên thế giới, trong đó có Việt Nam. Mặc dù đã có nhiều mô hình phát hiện bạo lực tự động được phát triển dựa trên trí tuệ nhân tạo, nhưng việc triển khai thực tế vẫn còn gặp nhiều khó khăn do độ phức tạp và chi phí tính toán lớn. Để khắc phục các hạn chế này, nghiên cứu của chúng tôi đề xuất xây dựng một mô hình C-ViDNet (Campus Violence Detection Network) phát hiện bạo lực học đường tự động với số lượng tham số nhỏ nhằm tăng cường khả năng phát hiện và phản ứng nhanh với các vụ việc bạo lực trong môi trường giáo dục. Đầu tiên, YOLOX được sử dụng để xác định của những người xuất hiện trong khung hình. Tiếp theo, tư thế của những người này được trích xuất bằng HRNet và chuyển đổi thành 3D Heatmap Volumes, giúp giảm nhiễu và loại bỏ các yếu tố nền không cần thiết. Sau đó, một kiến trúc gồm hai luồng được triển khai để học các đặc trưng từ 3D Heatmap Volumes. Trong đó, một luồng tập trung vào đặc trưng không gian của tư thế, trong khi luồng còn lại theo dõi sự thay đổi tư thế của con người giữa các khung hình. Kết quả từ C-ViDNet cho thấy tiềm năng trong việc phát triển mô hình phát hiện bạo lực học đường tự động. Giải pháp này không chỉ giảm bớt sự phụ thuộc vào giám sát thủ công mà còn đảm bảo phát hiện kịp thời các tình huống bạo lực, hỗ trợ nhà trường trong việc xây dựng môi trường an toàn hơn cho học sinh.

Chi tiết bài viết