ロボットがリップシンクを学習:音声・歌唱に合わせて唇を動かすAIを開発(A Robot Learns to Lip Sync)

2026-01-14 コロンビア大学

米国コロンビア大学工学部の研究チームは、人間の発話に合わせて口の動きを自律的に学習するロボット技術を開発した。従来のリップシンクは、音声と口形状の対応を人手で設計・制御する必要があったが、本研究では機械学習を用い、ロボット自身が音声信号と口部運動の関係を学ぶ点が特徴である。ロボットは人間の発話データを観測しながら、音の強弱やタイミングに応じた唇・顎の動きを最適化し、自然で同期した口の動きを実現した。この成果は、人と円滑にコミュニケーションできる対話ロボットやヒューマノイド開発に貢献するだけでなく、言語学習支援やリハビリテーション、エンターテインメント分野への応用も期待される。

ロボットがリップシンクを学習:音声・歌唱に合わせて唇を動かすAIを開発(A Robot Learns to Lip Sync)

<関連情報>

ヒューマノイド顔ロボットのためのリアルな唇の動きの学習 Learning realistic lip motions for humanoid face robots

Yuhang Hu, Jiong Lin, Judah Allen Goldfeder, Philippe M. Wyder, […] , and Hod Lipson
Science Robotics  Published:14 Jan 2026
DOI:https://doi.org/10.1126/scirobotics.adx3017

Abstract

Lip motion represents outsized importance in human communication, capturing nearly half of our visual attention during conversation. Yet anthropomorphic robots often fail to achieve lip-audio synchronization, resulting in clumsy and lifeless lip behaviors. Two fundamental barriers underlay this challenge. First, robotic lips typically lack the mechanical complexity required to reproduce nuanced human mouth movements; second, existing synchronization methods depend on manually predefined movements and rules, restricting adaptability and realism. Here, we present a humanoid robot face designed to overcome these limitations, featuring soft silicone lips actuated by a 10–degree-of-freedom mechanism. To achieve lip synchronization without predefined movements, we used a self-supervised learning pipeline based on a variational autoencoder (VAE) combined with a facial action transformer, enabling the robot to autonomously infer more realistic lip trajectories directly from speech audio. Our experimental results suggest that this method outperforms simple heuristics like amplitude-based baselines in achieving more visually coherent lip-audio synchronization. Furthermore, the learned synchronization successfully generalizes across multiple linguistic contexts, enabling robot speech articulation in 10 languages unseen during training.

0109ロボット
ad
ad
Follow
ad
タイトルとURLをコピーしました