지난 한 주 뉴요커에 실린 테드 창의 글 <ChatGPT는 웹의 흐릿한 JPEG입니다>라는 글이 화제였다. 번역기를 돌려 바로 읽어도 충분히 이해할 수 있어서 한 번 읽어보기를 추천한다.
글에서 가장 중요한 부분이자 요지는 아래와 같다.
ChatGPT를 웹에 있는 모든 텍스트의 흐릿한 JPEG*로 생각하십시오. JPEG가 고해상도 이미지의 많은 정보를 유지하는 것과 같은 방식으로 웹에서 많은 정보를 유지 하지만 정확한 비트 시퀀스를 찾는 경우 찾을 수 없습니다. 당신이 얻게 될 모든 것은 근사치입니다. 그러나 근사치는 ChatGPT가 만드는 데 탁월한 문법 텍스트의 형태로 제공되기 때문에 일반적으로 허용됩니다. 여전히 흐릿한 JPEG를 보고 있지만 사진 전체가 덜 선명하게 보이지 않는 방식으로 흐릿함이 발생합니다.
이 비유는 손실 압축 알고리즘에서 사용하는 일반적인 기술이 보간법이라는 점을 기억할 때 더욱 의미가 있습니다. 이미지 프로그램이 사진을 표시하고 압축 과정에서 손실된 픽셀을 재구성해야 할 때 주변 픽셀을 보고 평균을 계산합니다. 예를 들어, 독립 선언문 스타일을 사용하여 건조기에서 양말을 잃어버렸다고 설명하라는 메시지가 표시될 때 ChatGPT가 수행하는 작업입니다. "어휘 공간"에서 두 지점을 가져와 그 사이의 위치를 차지할 텍스트를 생성합니다. ("인간 사건의 과정에서 청결과 질서를 유지하기 위해 자신의 의복을 배우자와 분리해야 할 필요가 있게 됩니다...")
ChatGPT를 사용하면서 막연히 느꼈던 어떤 불일치, 어색함을 손실 압축으로 설명했다는 게 굉장히 와 닿았다. 답변에서 종종 생기는 오류나 잘못된 사실을 뻔뻔하게 설명하는 모습 등이 손실 압축에서 오는 오류라고 이해되면서 역시 그의 기존 글들처럼 굉장한 직관과 공명을 이끌어낸다고 생각했다. 손실 압축 비유 외에도 글쓰기에 대한 그의 이야기도 인상적이었다.
"당신의 초안은 명확하게 표현된 독창적이지 않은 아이디어가 아닙니다. 그것은 제대로 표현되지 않은 독창적인 아이디어이며, 무정형의 불만, 그것이 말하는 것과 당신이 말하고 싶은 것 사이의 거리에 대한 인식을 동반합니다.”
결과물이 아니라 결과물을 만드는 과정에서 인간 개개인의 경험과 인지의 도약은 역시 고유의 경험이다. 우리 대부분이 비슷한 내용을 생각하고 생산하지만 이 경험만큼은 각자 고유하고 소중하다.
탁월한 비유와 함께 확실히 어떤 오리지널리티를 가진 글이이었다. 제록스 인쇄실에서 있었던 실제 일화와 비유를 사용하며 인간에 대한 모종의 따뜻하고 의미있는 결론을 내렸기 때문이다. ChatGPT 열풍에 지친 많은 사람들이 그의 과학적이고 사실적인 어투와 단호한 결론을 통해 조금 위로 받거나 안도했을 거라고 본다.
-
그러나 사실 손실 압축 방식은 ChatGPT의 일부일 뿐이다.
GPT에 '머그가 있는 테이블 위에 머그를 놓으면'과 같이 약간의 물리학 지식이 필요한 질문을 할 수 있는데 '바닥에'가 아니라 '테이블에'라고 응답하는 것이 꽤 놀랍습니다. 웹에서 '실제 세계에서 객체는 서로를 단계적으로 통과하지 않는다'는 효과를 나타내는 문서를 찾기가 매우 어려울 것이라고 생각합니다. GPT는 모든 입력 텍스트가 세계에 대해 말하는 방식과 세계의 사물이 상호 작용하는 방식에서 이것을 선택했습니다. 그래서 그것도 '그냥 패턴 매칭'이라면 인간은 기본적으로 정확히 같은 방식으로 학습한다고 생각합니다. 즉, '외삽에 의한 일반 원리 학습'입니다. - Responding to Ted Chiang
이번 주 초에 일부 코드를 수정해야 했습니다. … 나는 내가 제공한 샘플에 사용된 언어를 식별하기 위해 ChatGPT로 전환한 다음 봇에게 내가 원하는 몇 줄을 추가하도록 도와달라고 요청했습니다. 모든 것이 완벽하게 작동했고 모든 문제가 몇 분 안에 해결되었습니다. 내가 고전적인 길을 갔다면 코드를 작성한 외부 공급업체와 계약을 맺고 코드를 수정하거나 실망스러운 검색 결과를 통해 Google 및 전원에 의존해야 했을 것입니다. - Reddit
뉴요커 글의 부재도 이렇게 묻고 있다.“OpenAI의 챗봇은 의역을 제공하는 반면 Google은 인용문을 제공합니다. 우리는 어느 것을 선호합니까?” 테드 창의 논지대로라면 인용문이 더 진실에 가깝다. 하지만 우리 대다수가 구글링하면서 찾아낸 사실들을 보간법 같은 방식으로 유추하고 결론내리는 방식으로 활용한다. 인용문은 충분히 진실로 가 닿을 수 있게 도와주는가하는 의문이 든다. 인공지능의 의역으로 얻는 지식에 대해 신뢰하는 행위를 할 것이냐 말 것이냐는 지극히 인간적으로, 인간처럼 인공지능을 생각하고 있기 때문에 생기는 감정일 수 있다.
ChatGPT가 아직 손실 압축처럼 보이는 결과물을 제공하거나, 테드 창의 글이 명확한 비유가 아니더라도 상관없다. 약간의 진실을 놓친 정보도, 불확실하고 명확하지 않은 비유도 우리의 삶을 바꾸며 많은 생각을 일으킨다. 기술 발전에 대한 어느 한 쪽의 의견을 지지하는 것보다 더 흥미롭게 느껴지는 부분이다.
-
*JPEG: JPEG는 상대적으로 높은 이미지 품질을 유지하면서 파일 크기를 크게 줄일 수 있는 널리 사용되는 이미지 압축 표준입니다. JPEG 압축은 정보가 일부 손실되기 때문에 손실 압축 방식입니다. 이는 원본보다 낮은 품질의 이미지를 만들어냅니다. 그러나 압축의 양은 파일 크기와 이미지 품질 간의 균형을 조절할 수 있습니다. 일반적으로 JPEG은 다양한 색상과 세부 사항이 있는 사진 이미지를 압축하는 데 적합하지만, 큰 단색 영역이나 날카로운 가장자리가 있는 이미지의 경우 블로킹(blocking)이나 블러링(blurring)과 같은 아티팩트가 발생할 수 있으므로 최적의 선택이 아닐 수도 있습니다.
*보간법(Interpolation): 보간법은 빠진 값을 추정하기 위해 이미 알려진 데이터를 사용하여 그 사이의 값을 예측하는 방법입니다. 예를 들어, 주어진 데이터 포인트의 집합으로부터 빠진 데이터 포인트를 추정하려는 경우, 보간법을 사용할 수 있습니다. 간단한 예시로, 아래와 같은 데이터가 있다고 가정해 봅시다.
- x 값: 1, 2, 3, 4
- y 값: 3, 5, ?, 9
여기서 누락된 y 값이 6일 때, 선형 보간법을 사용하여 이를 추정할 수 있습니다.
*손실 압축(Lossy compression): 손실 압축은 데이터를 압축하는 방법 중 하나로, 불필요한 정보를 제거하거나 변환하여 데이터의 크기를 줄이는 과정에서 일부 데이터가 손실되는 방식입니다. 즉, 원본 데이터와 압축된 데이터가 완전히 일치하지 않으며 일부 정보가 유실됩니다.