상단영역

UPDATED. 2024-04-28 17:55 (일)

본문영역

메타, 시각 인공지능 SAM 무료 배포

사진 속 물체 인식 후 분리 가능
체험 사이트 개설 및 깃허브에서 프로그램 공개

  • 기자명 HARRY GUINNESS 기자 & 육지훈 기자
  • 입력 2023.04.07 18:36
  • 수정 2024.04.23 10:54
글씨크기
메타 인공지능 SAM이 부엌 사진을 인식한 모습 [사진=메타]
메타 인공지능 SAM이 부엌 사진을 인식한 모습 [사진=메타]

메타는 5일 공식 블로그에서 이미지 인식 인공지능 SAM(Segment Anything Model)을 발표했다. 픽셀 뭉치 이미지에서 물체들을 각각 식별하고 분리해낼 수 있다. 컴퓨터가 주변 세계를 보고 이해하는 '세분화' 방식을 통해서다. 메타는 SAM을 무료로 배포하고 훈련 데이터 세트를 외부 연구원에게 제공 중이다. 메타는 웹브라우저로 접속 가능한 체험 사이트도 개설했다. 깃허브에 프로그램을 공개해 누구나 다운받을 수 있다.

스티븐 핑커는 1994년 자신의 책 '언어본능'에서 "AI 학계는 35년 동안 어려운 문제는 쉽고 쉬운 문제는 어렵다는 교훈을 배웠다"고 적었다. 모라벡의 역설이라 불리는 통찰은 30여 년이 지난 지금도 유효하다. GPT-4 같은 언어 모델은 몇 초 안에 사람처럼 글을 써낼 수 있다. 반면 블록줍기는 아주 어린 아이도 할 수 있지만 기계에는 까다로운 과제다.

세분화가 바로 '보기에는 쉽지만, 기술적으로는 어려운' 영역에 속한다. 인간은 책상 위를 보고 컴퓨터, 스마트폰, 종이 더미, 찢어진 휴지를 구분할 수 있다. 하지만 컴퓨터엔 모든 게 2D 형식의 디지털 값에 불과하다. 사진은 알록달록한 색의 집합일 뿐 어디까지가 컴퓨터고 휴지인지 알지 못한다.

SAM은 특정 물체를 분류하기 위한 전용 모델이 아니다. 메타 연구진은 "SAM은 물체란 무엇인지 일반적 개념을 배웠다"며 "어떤 이미지나 영상 속에서도 훈련 중 접하지 않았던 이미지 유형까지  인지해낼 수 있다"고 강조했다. 데이터로 배운 물체만 인식하는 게 아니라 다양한 개체를 추측해 낼 수 있다. SAM은 책상 휴지 하나를 구별하기 위해 수백 개 휴지 모양 자료로 가르칠 필요가 없다. 자신의 상식에 근거해 휴지를 알아본다.

SAM은 인터넷 브라우저에서 무료로 이용할 수 있다. 사용자가 마우스로 클릭하거나 주변 이미지를 묶어서 편집하는 기능을 지원한다. 구분해낸 이미지를 각각 따로 저장할 수도 있다. SAM은 문자로 한 명령도 알아듣는다. "고양이"를 입력하면 이미지에서 해당 동물을 찾는다. 다만 해당 기능은 아직 사용하지 못하게 막아두었다.

인터넷에서 이미지와 영상이 넘쳐나지만, 세분화 작업 훈련용 고품질 데이터는 얻기 힘들다. 메타는 자체적으로 'Segment Anything 10-billion'이라고 이름 지은 데이터베이스를 만들었다. 라이선스 이미지 약 1100만 개와 다양한 분할 이미지 세트 11억 개 이상이 들어있다. 이 중 몇몇 데이터는 손수 작업한 데이터 세트 수준의 품질을 보여준다. 메타는 누구나 자료 사이트(https://segment-anything.com/dataset/index.html)에서 데이터를 받아볼 수 있도록 했다.

메타는 세분화 프로그램에 대한 장대한 계획이 있다. 시각인식 기술은 잠재력이 높다. 인공지능과 로봇 공학에서 제대로 구현하기 어렵지만, 미래에는 다를 거라고 기대한다. 메타는 SAM이 증강 현실 안경을 통해 본 일상 도구들도 식별하게 될 것이라고 예상한다. 메타가 진행 중인 또 다른 프로젝트 Ego 4D도 같은 문제를 다른 해결책으로 풀려고 노력하고 있다. 사람들이 부엌에서 조리 도구 위에 뜨는 단계별 레시피를 따르거나 증강현실 메모를 개 그릇에 남길 수 있을지도 모른다.

SAM은 산업과 연구 분야에서도 많은 가능성을 가지고 있다. 그 예로 메타는 농부들이 소를 세거나 생물학자들이 현미경으로 세포를 추적하는 것을 도울 수 있다고 주장한다.

※이 기사는 popsci.com 원문을 바탕으로 작성됐으며, 번역은 파퓰러사이언스코리아 소속 기자가 도왔습니다.

/ 글 HARRY GUINNESS 기자 & 육지훈 기자  

저작권자 © 파퓰러사이언스 무단전재 및 재배포 금지
이 기사를 공유합니다

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

당신만 안 본 뉴스

하단영역

매체정보

  • 서울특별시 서대문구 경기대로 15 (엘림넷 빌딩) 1층
  • 대표전화 : 02-6261-6148
  • 팩스 : 02-6261-6150
  • 발행·편집인 : 김형섭
  • 법인명 : (주)에이치엠지퍼블리싱
  • 제호 : 파퓰러사이언스
  • 등록번호 : 서울중 라 00673
  • 등록일 : 2000-01-06
  • 발행일 : 2017-11-13
  • 청소년보호책임자 : 박노경
  • 대표 : 이훈, 김형섭
  • 사업자등록번호 : 201-86-19372
  • 통신판매업신고번호 : 2021-서울종로-1734
ND소프트