Towards Learning a Generic Agent for Vision-and-Language Navigation via Pre-training

Talking Papers Podcast with Yicong Hong - VLN BERTПодробнее

Grounded Entity-Landmark Adaptive Pre-Training for Vision-and-Language NavigationПодробнее

(CVPR 2023) Improving Vision-and-Language Navigation by Generating Future-View Image SemanticsПодробнее

Vision-Language Pre-training Survey PaperПодробнее

Learning Vision-and-Language Navigation from YouTube VideosПодробнее

[ICCV2021] Airbert: In-domain Pretraining for Vision-and-Language NavigationПодробнее

Vision-based navigation with language-based assistance (CVPR 2019)Подробнее

Towards Learning a Generic Agent for Vision-and-Language Navigation via Pre-TrainingПодробнее

[CVPR 2021 VQA2VLN Tutorial] Introduction to Vision Language NavigationПодробнее

Speaker-Follower Model for Vision-and-Language Navigation || Paper PresentationПодробнее

Vision-Language Navigation With Self-Supervised Auxiliary Reasoning TasksПодробнее

Cordelia Schmid: Transformers for Vision-Language Navigation and ManipulationПодробнее

Counterfactual Vision and Language LearningПодробнее

SASRA: Semantically-aware Spatio-temporal Reasoning Agent for Vision-and-Language NavigationПодробнее

Hybrid Learning for Vision-and-Language Navigation AgentsПодробнее

Vision-Dialog Navigation by Exploring Cross-Modal MemoryПодробнее

History Enhanced and Order Aware Pre Training for Vision and Language NavigationПодробнее

[ECCV 2022] ASSISTER: Assistive Navigation via Conditional Instruction GenerationПодробнее