Topic archive

Robotics AI news

Embodied systems, autonomy, simulation, and control. This page collects the latest briefings that match the topic so readers can follow one area without scanning the full feed.

Indexed briefings

Latest source-linked updates, ordered newest first.

Latest

Recent briefings

arXiv|Jul 1, 2026|1 min read

Rethinking Multi-Label Image Classification With Deep Learning: Taxonomy, Challenge, and Outlook

Focuses on Rethinking Multi-Label Image Classification With Deep Learning: Taxonomy, Challenge, and Outlook.

Computer Vision Healthcare Transformers

arXiv|Jun 30, 2026|1 min read

ABot-M0.5: Unified Mobility-and-Manipulation World Action Model

Focuses on ABot-M0.5: Unified Mobility-and-Manipulation World Action Model.

Computer Vision Robotics Healthcare

arXiv|Jun 29, 2026|1 min read

AI-Driven Synthesis for High-Tech System Design: Automating Innovation

Focuses on AI-Driven Synthesis for High-Tech System Design: Automating Innovation.

AI Robotics

arXiv|Jun 28, 2026|1 min read

RelBall: Relation Ball with Quaternion Rotation for Knowledge Graph Completion

Focuses on RelBall: Relation Ball with Quaternion Rotation for Knowledge Graph Completion.

AI 3d Vision Healthcare

arXiv|Jun 28, 2026|1 min read

Long-Term Prediction of Local and Global Human Motion with Occlusion Recovery

Focuses on Long-Term Prediction of Local and Global Human Motion with Occlusion Recovery.

Computer Vision Healthcare Transformers

arXiv|Jun 27, 2026|1 min read

Drop-Then-Recovery: How Redundant Are Vision-Language-Action Models?

Focuses on Drop-Then-Recovery: How Redundant Are Vision-Language-Action Models?.

Robotics AI Healthcare

arXiv|Jun 24, 2026|1 min read

Learning Motion Feasibility from Point Clouds in Cluttered Environments

Focuses on Learning Motion Feasibility from Point Clouds in Cluttered Environments.

Robotics AI Scene Understanding

arXiv|Jun 23, 2026|1 min read

Teaching LLMs String Matching, Backtracking, and Error Recovery to Deduce Bases and Truth Tables for the Combinatorially Exploding Bit Manipulation Puzzles

Focuses on Teaching LLMs String Matching, Backtracking, and Error Recovery to Deduce Bases and Truth Tables for the Combinatorially Exploding Bit Manipulation Puzzles.

AI Healthcare Llm Research

arXiv|Jun 23, 2026|1 min read

Learning Process Rewards via Success Visitation Matching for Efficient RL

Focuses on Learning Process Rewards via Success Visitation Matching for Efficient RL.

Machine Learning AI Robotics

arXiv|Jun 23, 2026|1 min read

An Integrated Hardware-Software Design for Low-Data Spatial Defect Detection in Robotic Visual Inspection with Hybrid Optoelectronic Neural Networks

Focuses on An Integrated Hardware-Software Design for Low-Data Spatial Defect Detection in Robotic Visual Inspection with Hybrid Optoelectronic Neural Networks.

Robotics Computer Vision Healthcare

arXiv|Jun 23, 2026|1 min read

NoContactNoWorries: Estimating Contact through Vision and Proprioception for In-Hand Dexterous Manipulation

Focuses on NoContactNoWorries: Estimating Contact through Vision and Proprioception for In-Hand Dexterous Manipulation.

Robotics AI Healthcare

arXiv|Jun 23, 2026|1 min read

Reward-Conditioned Attention: How Reward Design Shapes What Autonomous Driving Agents See

Focuses on Reward-Conditioned Attention: How Reward Design Shapes What Autonomous Driving Agents See.

Machine Learning AI Scene Understanding

arXiv|Jun 23, 2026|1 min read

AeroCast: Probabilistic 3D Trajectory Prediction for Non-Cooperative Aerial Obstacles via Transformer-MDN Architecture

Focuses on AeroCast: Probabilistic 3D Trajectory Prediction for Non-Cooperative Aerial Obstacles via Transformer-MDN Architecture.

Robotics AI Machine Learning

arXiv|Jun 22, 2026|1 min read

A Generative Model for Closed-Loop Microsimulation of Signalized Intersections

Focuses on A Generative Model for Closed-Loop Microsimulation of Signalized Intersections.

Robotics AI Healthcare

arXiv|Jun 22, 2026|1 min read

RE4: Transformation-aware Imitation of Object Interactions Using Manipulation Modes

Focuses on RE4: Transformation-aware Imitation of Object Interactions Using Manipulation Modes.

Robotics Machine Learning Healthcare

arXiv|Jun 22, 2026|1 min read

Power-Flexible AI Data Centers: A New Paradigm for Grid-Responsive Compute

Focuses on Power-Flexible AI Data Centers: A New Paradigm for Grid-Responsive Compute.

AI Healthcare Autonomous Driving

arXiv|Jun 20, 2026|1 min read

The Token Is a Group Element: On Lie-Algebra Attention over Matrix Lie Groups

Focuses on The Token Is a Group Element: On Lie-Algebra Attention over Matrix Lie Groups.

Machine Learning Computer Vision Graphics

arXiv|Jun 19, 2026|1 min read

Frequency-Aware Flow Matching for Continuous and Consistent Robotic Action Generation

Focuses on Frequency-Aware Flow Matching for Continuous and Consistent Robotic Action Generation.

Robotics AI Healthcare

arXiv|Jun 18, 2026|1 min read

Co-policy: Responsive Human-Robot Co-Creation for Musical Performances

Focuses on Co-policy: Responsive Human-Robot Co-Creation for Musical Performances.

Robotics AI 3d Generation

arXiv|Jun 17, 2026|1 min read

RoboSSM: Scalable In-context Imitation Learning via State-Space Models

Focuses on RoboSSM: Scalable In-context Imitation Learning via State-Space Models.

Robotics AI Healthcare

arXiv|Jun 14, 2026|1 min read

Causal Object-Centric Models for Planning with Monte Carlo Tree Search

Focuses on Causal Object-Centric Models for Planning with Monte Carlo Tree Search.

AI Machine Learning Robotics

arXiv|Jun 12, 2026|1 min read

Mana: Dexterous Manipulation of Articulated Tools

Focuses on Mana: Dexterous Manipulation of Articulated Tools.

Robotics AI Computer Vision

arXiv|Jun 12, 2026|1 min read

MaskWAM: Unifying Mask Prompting and Prediction for World-Action Models

Focuses on MaskWAM: Unifying Mask Prompting and Prediction for World-Action Models.

Computer Vision Machine Learning Robotics

arXiv|Jun 12, 2026|1 min read

WAM4D: Fast 4D World Action Model via Spatial Register Tokens

Focuses on WAM4D: Fast 4D World Action Model via Spatial Register Tokens.

Computer Vision Robotics 3d Vision

arXiv|Jun 12, 2026|1 min read

NavWAM: A Navigation World Action Model for Goal-Conditioned Visual Navigation

Focuses on NavWAM: A Navigation World Action Model for Goal-Conditioned Visual Navigation.

Robotics Computer Vision Healthcare

arXiv|Jun 9, 2026|1 min read

Envision4D: Envisioning Visual Futures via Feed-forward 4D Gaussian Splatting for Autonomous Driving

Focuses on Envision4D: Envisioning Visual Futures via Feed-forward 4D Gaussian Splatting for Autonomous Driving.

Computer Vision 3d Generation Scene Understanding

arXiv|Jun 9, 2026|1 min read

Diffusion Transformer World-Action Model for AV Scene Prediction

Focuses on Diffusion Transformer World-Action Model for AV Scene Prediction.

Computer Vision AI Machine Learning

arXiv|Jun 9, 2026|1 min read

Dexterous Point Policy: Learning Point-based Dexterous Hand Policies from Human Demonstrations

Focuses on Dexterous Point Policy: Learning Point-based Dexterous Hand Policies from Human Demonstrations.

Robotics Computer Vision Machine Learning

arXiv|Jun 9, 2026|1 min read

AgenticRL: Self-Refining Agentic Reinforcement Learning for Vision-Conditioned UAV Navigation

Focuses on AgenticRL: Self-Refining Agentic Reinforcement Learning for Vision-Conditioned UAV Navigation.

Robotics AI Scene Understanding

arXiv|Jun 3, 2026|1 min read

Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking

Focuses on Humanoid-GPT: Scaling Data and Structure for Zero-Shot Motion Tracking.

Robotics AI Computer Vision

arXiv|Jun 3, 2026|1 min read

SEAOTTER: Sensor Embedded Autoencoding with One-Time Transcode for Efficient Reconstruction

Focuses on SEAOTTER: Sensor Embedded Autoencoding with One-Time Transcode for Efficient Reconstruction.

Medical Imaging Computer Vision Machine Learning

arXiv|Jun 3, 2026|1 min read

DyaPlex: Full-Duplex Speech-Motion Model for Dyadic Interaction

Focuses on DyaPlex: Full-Duplex Speech-Motion Model for Dyadic Interaction.

Computer Vision Robotics Healthcare

arXiv|Jun 2, 2026|1 min read

Multimodal Action Diffusion for Robust End-to-End Autonomous Driving

Focuses on Multimodal Action Diffusion for Robust End-to-End Autonomous Driving.

Computer Vision Healthcare Diffusion

arXiv|Jun 2, 2026|1 min read

Learning Action-Conditional and Object-Centric Gaussian Splatting World Models for Rigid Objects

Focuses on Learning Action-Conditional and Object-Centric Gaussian Splatting World Models for Rigid Objects.

Robotics Computer Vision Machine Learning

arXiv|Jun 1, 2026|1 min read

Learned Non-Maximum Suppression for 3D Object Detection

Focuses on Learned Non-Maximum Suppression for 3D Object Detection.

Computer Vision AI Machine Learning

arXiv|May 31, 2026|1 min read

BotDirector: Robot Storytelling Across the Symmetrical Reality with Multi-modal Interactions

Focuses on BotDirector: Robot Storytelling Across the Symmetrical Reality with Multi-modal Interactions.

Robotics AI Healthcare