“데이터 소유 가능하다”…바나(VANA), 사용자 중심 AI 혁신 추진

“우리는 인공지능(AI)을 더 똑똑하게 만들 데이터가 부족하다. 그 이유는 대부분의 데이터가 사용자 플랫폼 안에 갇혀 있기 때문이다.”
AI와 데이터 주권을 결합한 프로젝트 ‘바나(Vana)’를 이끄는 안나 카즐라우스카스(Anna Kazlauskas)는 최근 미국 일리노이대에서 열린 강연에서 이렇게 말했다.
안나는 오픈데이터랩스(Open Data Labs) 최고경영자(CEO)이자 바나의 창립자다. 그는 “데이터는 사용자 것이며 사용자가 직접 이를 회수하고 제어하고 AI를 학습시키는 데 활용할 수 있어야 한다”고 밝혔다.
현재의 AI 모델들은 대부분 인터넷에 공개된 데이터를 바탕으로 훈련된다. 하지만 카즐라우스카스는 이 데이터들이 전체 디지털 정보 중 불과 0.1%~4% 수준에 불과하다고 지적했다. 그는 “공개된 데이터는 15조 토큰에 달하지만 이미 최신 AI 모델은 이 양만큼 훈련을 마쳤으며 더 나은 모델을 만들려면 나머지 96%의 데이터에 접근해야 한다”고 말했다.
하지만 문제는 그 나머지 대부분이 대형 플랫폼의 벽 안에 갇혀 있다는 점이다. 사용자가 매일 쌓아가는 아마존 알렉사 대화 로그, 테슬라 운전 기록, 소셜미디어 광고 클릭 데이터 등은 대부분 기업 서버에 저장돼 있으며 외부에서는 접근조차 어렵다.
바나는 이처럼 갇힌 데이터를 사용자 손에 되돌려주는 데 집중한다. 안나는 이를 ‘디지털 자산 회복 운동’으로 간주한다. 그는 “주차장에 차를 댔다고 주인이 바뀌는 것이 아니듯 플랫폼에 데이터를 저장했다고 소유권이 사라지진 않는다”고 주장했다.
카즐라우스카스에 따르면 유럽의 일반개인정보보호법(GDPR)과 미국 캘리포니아주의 소비자 프라이버시법(CCPA) 등은 사용자에게 데이터 ‘내보내기 권한(data portability)’을 보장한다. 바나는 이 권리를 기술적으로 실현하는 플랫폼이다. 사용자는 바나를 통해 자신의 데이터를 요청하고 구조화하며 이를 기반으로 AI 모델을 훈련시킬 수 있다.
바나가 제시하는 두 번째 혁신은 ‘데이터다오(DataDAO)’다. 이는 유사한 데이터를 가진 사용자들이 자율적으로 모여 만드는 공동체로 각 탈중앙 자율조직(DAO)은 투표를 통해 데이터 제공 여부나 사용처를 결정한다. 일종의 ‘데이터 노동조합’이자 ‘탈중앙 AI 학습 풀’이다.
현재 운영 중인 DAO 중에는 레딧 사용자 14만명의 소셜미디어 데이터 DAO, 테슬라 차량 데이터 DAO, 스포티파이 음악 청취 DAO 등이 있다. 각 DAO는 ‘기여 증명(Proof of Contribution)’ 시스템을 통해 데이터의 신뢰성과 품질을 확보하고 조작 시도를 차단한다.
카즐라우스카스는 “패션 구매 이력과 차량 구매 데이터를 연결하는 ‘크로스 데이터’ 분석이 가능해지면 전혀 새로운 AI 응용이 가능해진다”고 강조했다.
데이터 주권을 주장하면서도 바나는 보안과 프라이버시를 놓치지 않는다. 바나의 시스템은 개별 데이터에 개인 키로 1차 암호화한 뒤 DAO가 보유한 키로 다시 암호화한다. 연산은 신뢰실행환경(TEE) 내부에서만 수행되며 DAO 투표로 승인된 연산만 실행된다.
안나는 “아무도 사용자의 원시 데이터를 직접 볼 수 없고 승인을 받아야만 제한된 분석이 가능하다. 우리는 이중 암호화와 안전 연산 구조로 사용자의 신뢰를 확보하고 있다”고 설명했다.
안나 카즐라우스카스는 바나를 단순한 기술 스타트업이 아닌 사용자 주권을 위한 인프라 구축 사업으로 규정했다. 그는 “AI가 민주적으로 발전하려면 데이터 역시 사용자 손에서 출발해야 한다”고 강조했다.
바나는 기술적 도구를 제공할 뿐 아니라 ‘데이터는 노동이며 사용자는 기여에 따라 보상을 받아야 한다’는 철학을 공유하고 있다. 이 같은 관점은 ‘플랫폼이 데이터의 소유자’라는 기존 인식을 근본부터 흔들고 있으며 데이터 경제의 힘의 균형을 바꾸고 있다.
기스 경영대학에서 이뤄진 이번 강연은 AI, 데이터, 블록체인 기술이 교차하는 지점에서 사용자 중심 패러다임이 실현될 가능성을 보여준 사례로 평가된다.
카즐라우스카스는 마지막으로 “데이터는 이제 공공재이자 생산 수단이 될 수 있으며 그것을 제어하고 활용하는 권리를 사용자에게 돌려줘야 한다”고 밝혔다.