Chapter 6: 손과 촉각 — 수작업 자동화의 마지막 병목
제조 수작업의 마지막 병목은 손이다. 사람은 물체를 보지 않아도 미끄러짐, 접촉, 압력, 재질 변화를 손끝으로 느끼며 grip force를 조정한다 [1]. 로봇은 아직 이 능력이 약하다. 그래서 화장품, 식품, 의류, 전자 조립에서 "사람이 하면 쉬운데 로봇은 어려운" 작업이 남는다.
6.1 VLA만으로는 손이 되지 않는다
RT-2, OpenVLA, Octo, pi0 계열은 언어/비전/행동을 연결했지만, 접촉이 지배하는 작업에서는 force와 tactile feedback이 필요하다. 예를 들어 튜브를 집어 트레이에 넣는 작업은 6-DoF pose만 맞추면 되는 것이 아니다. 너무 세게 잡으면 찌그러지고, 너무 약하면 미끄러진다.
6.2 촉각 데이터의 부상
GelSight, DIGIT, ReSkin, AnySkin, Sparsh, Tactile-VLA, ForceVLA 같은 흐름은 촉각을 foundation model의 입력으로 끌어올리고 있다 [2] [3] [4]. NVIDIA의 reference humanoid가 Sharpa tactile five-finger hands를 포함한 것은 상징적이다 [6]. 손과 촉각이 없으면 humanoid는 제조 수작업의 많은 영역에 들어가기 어렵다.
6.3 제조 적용의 우선순위
가장 먼저 자동화할 작업은 촉각이 덜 필요한 표준 pick/place다. 다음은 손목 카메라와 force threshold로 충분한 삽입/체결/검사다. 마지막이 deformable, slippery, hygienic, sticky material handling이다. 이 순서를 무시하고 어려운 수작업부터 휴머노이드에 맡기면 실패한다.
참고문헌
- Roland Johansson and J. Randall Flanagan (2009). Coding and Use of Tactile Signals from the Fingertips in Object Manipulation Tasks. Nature Reviews Neuroscience.
- Wenzhen Yuan et al. (2017). GelSight: High-Resolution Robot Tactile Sensors. Sensors.
- Mike Lambeta et al. (2020). DIGIT: A Novel Design for a Low-Cost Compact High-Resolution Tactile Sensor. arXiv.
- Raunaq Bhirangi et al. (2021). ReSkin: Versatile, Replaceable, Lasting Tactile Skins. arXiv.
- Carolina Higuera et al. (2024). Sparsh: Self-Supervised Touch Representations. Meta AI Research.
- NVIDIA (2026). NVIDIA Announces Isaac GR00T Reference Humanoid Robot. NVIDIA Investor Relations.