Multimodal AI: 'Phù Thủy' Kết Nối Âm Thanh, Văn Bản và Tìm Kiếm Véc-tơ