선 세줄 요약
1. 동물의 언어를 해석하는 방법으로 현재 크게 두 시도가 있다.
2. 동물의 언어 행위를 사전처럼 만들어서 해석한다.
3. 동물이 사용하는 단어의 좌표를 만들어서 지도로 만들어서 인간의 언어와 비교한다.

몇몇 동물들은 어린 인간 정도의 인지 능력을 가지고 있다고 여겨짐
이 사실을 전제로 동물에게 인간의 언어를 학습시키는 행위
예컨대 천재 고릴라 코코에게 수화를 가르쳐서 대화를 하거나
가까운 사례로는 반려견에게 앉아, 기다려 같은 간단한 단어를 가르쳐서 교감하는
그런 행위를 시도해왔음.
하지만 생물학, 동물행동학, 언어학, 그리고 컴퓨터 기술과 AI의 발전으로
동물들이 쓰는 언어 자체를 해석하고자 하는 시도가 이어지고 있음
두 가지 대표적인 사례를 들자면
1. 프로젝트 CETI
2017년, 데이비드 그루버 박사가 향유고래의 울음소리를 연구하던 중에
암호학자이자 튜링상 수상자인 샤피 골드와서 박사가
울음소리를 듣곤 모스부호와 유사하다는 이야기를 함
(향유고래의 언어 행위-코다)
이 발상을 토대로 과학자들은 향유고래의 언어 행위-코다를
AI 머신러닝으로 돌려서
패턴을 찾아내기로 함.
이들의 연구를 토대로
2019년, 50여명의 생물학, 행동학, 언어학, 컴퓨터와 AI 전문가들이 모여서
토의한 결과, 향유고래의 언어를 해석할 가능성이 있다고 결론을 내림.
그래서 탄생한 게 프로젝트 CETI
정식 이름은 고래류 번역 프로젝트
연구팀은 카리브해의 도미니카의 한 섬 인근 수중에
가로 세로 20km의 거대한 녹음 스튜디오를 마련함. 말 그대로 바닷속에 녹음기를 설치한 거.
그렇게 향유고래의 코다를 수집하기 시작했고
드론을 이용해 고래의 몸에 녹음기와 추적기 등 각종 센서를 달아
코다를 발화할 때의 상황적 맥락을 연구했음
이렇게 모인 방대한 데이터를
AI로 돌린 결과
향유고래의 언어 행위의 4가지 층위를 발견함
첫 번째 층위는 코다의 속도-단어
두 번째 층위는 코다의 클릭 수-접미사처럼 작용
세 번째 층위는 클릭 사이의 멈춤을 조절-감정을 표현
네 번째 층위는 코다의 미세한 타이밍 조절-인간의 모음처럼 작용
이렇게 만들어진 데이터는
마치 향유고래 언어의 사전처럼 작용했고
이를 통해 향유고래는 가족 무리(클랜)마다
고유한 문화와 방언이 있고
더욱이 유년기-청소년기의 어린 고래들이 언어를 학습하면서
새로운 방언을 만들어 낸다는 사실까지 밝혀냄
이런 연구 결과를 토대로
2023년 연구팀은 향유고래에게 자신의 위치를 알리는 코다를 쏘아 보냈고
실제로 몇몇 향유고래가 코다를 쏘아보낸 인간 연구진에게 다가왔고
그 이후로는 고래들 사이에서 활발히 언어 행위를 하며
마치, 육지에서 온 두 발 짐슴에 대해 토론하는 듯한 모습을 보였다고 함.
2. 지구 종 프로젝트(Earth species project; ESP)
ESP는 2017년 실리콘밸리의 비영리 연구재단에서 시작함.

앞선 프로젝트 CETI가 사전을 만들어서 동물의 언어를 해석하는 거라면
ESP는 동물의 사용하는 언어의 구체적 발화-즉 '단어'를 매핑하여
다차원 좌표 상에 구현하는 것임.
이게 무슨 말이냐.
인간 언어의 단어 하나하나를 좌표화 한 다음에
이걸 컴퓨터가 시뮬레이션 한 다차원 공간에 찍으면 마치 은하의 지도처럼 보일 거임.
중요한 건 단어의 좌표를 찍을 때, 무작위로 찍는 게 아니라
문맥상 비슷한 것끼리 가까이 배치하는 것임.
예컨대, 강아지와 늑대는 가깝게
강아지와 냉장고는 아주 멀게.
이렇게 만들어진 좌표들의 다차원 공간-언어 지도에서 놀라운 점은
단어들의 관계가 기하학적인 방향과 거리가 일정하게 나타난다는 것
예컨대, [왕King]이란 좌표에서 [남자Man]이란 좌표값을 빼고, [여자Woman]이란 좌표값을 넣으면
신기하게도 [여왕Queen]이라는 좌표에 도착함.
단어의 의미가 위치와 방향으로 보존되는 것임
(인문학적 소양이 있다면 구조주의를 떠올릴 수도 있는데, 실제로 ESP가 사용하는 '벡터공간모델'은 구조주의 언어학적 아이디어인 '분포 가설'과 밀접함)
여기서 가설을 세울 수 있음.
만약 다른 동물도 '슬픔', '굶주림', '어미', '새끼'와 같은 개념을 공유한다면
그 동물의 언어 지도도 인간의 언어 지도와 겹쳐서 볼 수 있지 않을까? 하는 거임
예컨대 인간 쪽 데이터의 '어미' 위치에서 고래가 '끼룩'이라고 했다면?
그렇다면 고래어 사전이 없이도 저 '끼룩'이란 단어가 '어미'를 뜻한다는 걸 추론할 수 있음.
이렇게 지도를 계속 겹쳐서 확인하다보면
동물의 언어도 해석할 수 있게 된다는 개념인 거지.
물론 위의 프로젝트 CETI, ESP 모두
움벨트(각 개체가 가지고 있는 감각과 인지 능력을 바탕으로 한 주관적 세계)의 차이 때문에
정확히 번역이 가능한지는 아직 미지수임
하지만 그래도 연구가 되는 이유는
1. 만약 외계 지성체가 발견된다면, 그에 앞서 인간 외 존재에 대한 해석 경험이 필요하기 때문
2. 인간 중심적 시각에서 탈피하여 비인간 인격체의 실재를 확인할 수 있기 때문
라고 요약할 수 있음
LLM 원리랑 살짝 비슷하네
언어가 2진법 숫자로 변환 가능하다는 게 직관적으로 와닿지 않았는데 좌표라고 말하니까 훨씬 이해가 쉽네