최소제곱법
최소제곱법은 교과서 속에만 머물지 않습니다. 카메라의 흔들림 보정, 인공지능의 학습 과정, 경제지표 예측까지 거의 모든 데이터 분석의 출발점에 놓여 있습니다. 우리가 스마트폰으로 찍은 사진이 또렷해지는 데에도, 검색 결과가 점점 정교해지는 데에도 이 아이디어가 숨어 있습니다. 정확한 답이 없는 세계에서 가장 설득력 있는 답을 찾는 방법입니다.
최소제곱법은 교과서 속에만 머물지 않습니다. 카메라의 흔들림 보정, 인공지능의 학습 과정, 경제지표 예측까지 거의 모든 데이터 분석의 출발점에 놓여 있습니다. 우리가 스마트폰으로 찍은 사진이 또렷해지는 데에도, 검색 결과가 점점 정교해지는 데에도 이 아이디어가 숨어 있습니다. 정확한 답이 없는 세계에서 가장 설득력 있는 답을 찾는 방법입니다.
점 2개가 주어지면 그 둘을 정확히 지나는 직선은 하나로 정해집니다. 이건 중학교 수학에서도 자연스럽게 받아들이는 사실입니다. 그런데 점이 3개라면 어떨까요? 혹은 4개라면요. 대부분의 경우, 그 모든 점을 정확히 지나는 직선은 존재하지 않습니다. 어느 점을 맞추면 다른 점이 어긋나고, 다른 점을 맞추면 또 다른 곳에서 틈이 생깁니다. 이때 우리는 질문을 바꿀 수밖에 없습니다. “정확한 답은 무엇인가?”가 아니라 “가장 적절한 답은 무엇인가?”로 말이죠.
18세기, 천문학자들은 기존의 천체 위치를 관측해 그 움직임을 예측하거나 새로운 행성을 발견하려고 시도했습니다. 하지만 측정값은 매번 달랐습니다. 분명 천체의 궤도는 정확하고 매끄러울 텐데, 인간의 실수까지 겹치면서 조금씩 다른 자료 중에서 어떤 값을 믿고 어떤 값을 버릴지 알 수 없었습니다. 마치 불규칙한 노이즈가 끼어 있는 것 같았죠. 많은 학자가 이 문제에 어려움을 겪었는데, 그중에서도 독일의 수학자 가우스는 이런 문제를 집요하게 파고들었습니다.
가우스는 오차를 제곱해 합을 최소로 만드는 값이 가장 합리적이라고 보았습니다. 이후 이 방법은 통계학과 데이터 분석의 기본 도구로 자리 잡게 됩니다. 실험값에는 오차가 섞여 있고, 관측에는 언제나 흔들림이 있습니다. 그렇다면 이런 데이터 앞에서 우리는 어떻게 ‘정답’을 이야기할 수 있을까요. 이 질문에서 출발한 방법이 바로 최소제곱법입니다.
최소제곱법은 오차들을 제곱해 더한 값이 가장 작아지도록 만드는 방법입니다. 모든 점을 정확히 지나는 직선을 찾는 것이 아니라, 가장 그럴듯하게 지나가는 직선을 찾는 것이 목적입니다. 여기서 중요한 태도 하나가 드러납니다. 현실의 데이터가 완벽하지 않다는 사실을 인정하면서도 더 나아갈 수 있는 방법을 찾아냈다는 점입니다.
예를 들어 (1, 2), (2, 2), (3, 4)의 세 점이 있다고 해봅시다. 이 세 점을 정확히 모두 지나는 직선은 존재하지 않습니다. 하지만 우리는 이 점들을 대략적으로 관통하는 직선을 하나 그릴 수는 있습니다. 어떤 직선이 더 좋은 직선일까요? 각 점에서 직선까지의 세로 거리, 즉 오차를 구하고, 그 오차들을 제곱해 모두 더합니다. 이 합이 가장 작아지도록 만드는 직선이 바로 최소제곱법이 선택한 직선입니다.
오차를 제곱함으로써 미세한 오차에는 베네핏을, 큰 오차에는 페널티를 주면서 적절한 직선을 결정할 수 있습니다. 그전에는 눈대중으로 그린 ‘적당한 직선’을 그려보는 것에 그쳤지만, 이를 통해 확실한 수학적 기준을 부여한 셈입니다.
![거인의 키에 속지 않는 지혜, 통계로 배우죠 [재미있는 수학]](https://img.hankyung.com/photo/202601/AA.43126708.3.jpg)
![가중치 합으로 놀이기구 최단 경로 파악하죠 [재미있는 수학]](https://img.hankyung.com/photo/202601/AA.42981104.3.jpg)
![[재미있는 수학] 우리가 수학을 공부하는 5가지 이유](https://img.hankyung.com/photo/202601/AA.42910885.3.jpg)