Truy xuất hình ảnh sử dụng phương pháp kết hợp xếp hạng và Vision transformer
Từ khóa:
truy vấn ảnh theo nội dung, xếp hàng truy vấn ảnh, học chuyển tiền visionTóm tắt
Truy xuất hình ảnh là một nhiệm vụ quan trọng trong thị giác máy tính liên quan đến việc truy xuất các hình ảnh có liên quan từ cơ sở dữ liệu hình ảnh dựa trên nội dung trực quan của chúng. Phương pháp truyền thống có thể không nắm bắt được ý nghĩa ngữ nghĩa của hình ảnh một cách hiệu quả, dẫn đến kết quả truy xuất dưới mức tối ưu. Trong bài báo này, chúng tôi đề xuất phương pháp truy xuất hình ảnh theo nội dung (Content Based Images Retrieval - CBIR) dựa trên kiến trúc mạng Vision Transformer kết hợp phương pháp VisualRank để xếp hạng các hình ảnh dựa trên sự tương đồng của chúng với hình ảnh truy vấn. Qua kết quả đào tạo cho thấy mô hình đề xuất đạt độ chính xác lên đến 97%.
Tải xuống
Chi tiết
- Ngày nhận: 06-01-2025
- Sửa lần cuối: 06-01-2025
- Ngày quyết định: 08-01-2025
- Ngày xuất bản: 08-01-2025
- Tiêu đề: Truy xuất hình ảnh sử dụng phương pháp kết hợp xếp hạng và Vision transformer
- DOI:
- Lượt xem: 0
- Lượt tải xuống: 0