Part II: 로봇 조작 기술의 최전선

Chapter 6: 손과 촉각 — 수작업 자동화의 마지막 병목

집필일: 2026-06-08 최종수정일: 2026-06-08

제조 수작업의 마지막 병목은 손이다. 사람은 물체를 보지 않아도 미끄러짐, 접촉, 압력, 재질 변화를 손끝으로 느끼며 grip force를 조정한다 [1]. 로봇은 아직 이 능력이 약하다. 그래서 화장품, 식품, 의류, 전자 조립에서 "사람이 하면 쉬운데 로봇은 어려운" 작업이 남는다.

Figure 6.1: Diffusion Policy가 시각 관측에서 행동 sequence를 생성하는 조작 정책 구조. source: S3 reused figure
Figure 6.1: Diffusion Policy가 시각 관측에서 행동 sequence를 생성하는 조작 정책 구조. source: S3 reused figure

6.1 VLA만으로는 손이 되지 않는다

RT-2, OpenVLA, Octo, pi0 계열은 언어/비전/행동을 연결했지만, 접촉이 지배하는 작업에서는 force와 tactile feedback이 필요하다. 예를 들어 튜브를 집어 트레이에 넣는 작업은 6-DoF pose만 맞추면 되는 것이 아니다. 너무 세게 잡으면 찌그러지고, 너무 약하면 미끄러진다.

6.2 촉각 데이터의 부상

GelSight, DIGIT, ReSkin, AnySkin, Sparsh, Tactile-VLA, ForceVLA 같은 흐름은 촉각을 foundation model의 입력으로 끌어올리고 있다 [2] [3] [4]. NVIDIA의 reference humanoid가 Sharpa tactile five-finger hands를 포함한 것은 상징적이다 [6]. 손과 촉각이 없으면 humanoid는 제조 수작업의 많은 영역에 들어가기 어렵다.

6.3 제조 적용의 우선순위

가장 먼저 자동화할 작업은 촉각이 덜 필요한 표준 pick/place다. 다음은 손목 카메라와 force threshold로 충분한 삽입/체결/검사다. 마지막이 deformable, slippery, hygienic, sticky material handling이다. 이 순서를 무시하고 어려운 수작업부터 휴머노이드에 맡기면 실패한다.

참고문헌

  1. Roland Johansson and J. Randall Flanagan (2009). Coding and Use of Tactile Signals from the Fingertips in Object Manipulation Tasks. Nature Reviews Neuroscience.
  2. Wenzhen Yuan et al. (2017). GelSight: High-Resolution Robot Tactile Sensors. Sensors.
  3. Mike Lambeta et al. (2020). DIGIT: A Novel Design for a Low-Cost Compact High-Resolution Tactile Sensor. arXiv.
  4. Raunaq Bhirangi et al. (2021). ReSkin: Versatile, Replaceable, Lasting Tactile Skins. arXiv.
  5. Carolina Higuera et al. (2024). Sparsh: Self-Supervised Touch Representations. Meta AI Research.
  6. NVIDIA (2026). NVIDIA Announces Isaac GR00T Reference Humanoid Robot. NVIDIA Investor Relations.