본문 바로가기
  • 블랜더 거실
독서습관

[992]수학자의 생각법 ③_데이터와 확률 그리고 네트워크의 지름길

by bandiburi 2024. 12. 31.

(출처: stockcake.com)

<수학자의 생각법> 세 번째 포스팅이다. 
각 장마다 응용 사례를 접목해서 친절하게 알려준다.
때로는 100퍼센트 이해하지 못하고 넘어가야 하는 문장도 있다. 
그래도 수학이 일상 속에 어떻게 적용되고 있는지 이해하는데 충분한 역할을 하는 책이다. 

마지막 장에서는 카지노에서 등장하는 게임이 등장한다. 
대부분의 게임은 확률이다. 
왜 카지노가 유리하게 설계되어 있는지 설명해 준 부분이 유익했다.

흥미로운 문장과 소감을 이어간다. 

제7장 데이터의 지름길

1920년대 이후로 20분의 1이라는 무작위 확률은 어떤 발견이 공표할 수 있을 정도로 '통계적으로 유의미하다'라고 여겨지려면 통과해야 할 임계값이 되었다. 이것을 'P값이 0.05보다 작다'라고 표현한다(p값은 '유의확률'이라고 일컫는다-옮긴이). 여기서 20분의 1은 그 일이 우연히 일어날 수 있는 확률이 5퍼센트라는 것을 나타낸다. (...) 유의성을 판단하는 기준은 신중하게 다룰 필요가 있다. 2019년 3월, 850명의 과학자들은 <네이처>에 편지를 보내 P값을 과학적 발견의 척도로 삼는 과학계의 강박관념에 반대하는 입장을 피력하였다. " (...) 단지 우리는 전통적인 이분법으로 연구 결과가 과학적 가설을 뒷받침하는지 아니면 기각하는지 결정하는 용도로써 P값 사용을 중단하기를 요구하는 것이다."(296~297)

회사에서 통계분석을 많이 사용한다.
분석 결과에 대한 논리적 설득력을 높이기 위해 가끔은 P값을 활용한다. 
P값이 0.05보다 작을 경우 '효과가 있다', '개선되었다' 등으로 판단한다. 
하지만 저자는 0.05라고 해도 20분의 1의 무작위 확률일 뿐이라며 이분법적 적용을 경계한다. 
회사에서 통계적 분석법을 배우면서도 P값에 대해 왜라는 의문을 제기한 적이 없었다. 

퍼즐 속 상금을 최대로 얻을 수 있는 기회를 최적화하는 데 있어 핵심 역할을 하는 것은 수학에서 π(파이) 다음으로 인기 있는 오일러 수(자연상수) e다. e는 2.71828182...를 가리키며 π처럼 소수점이 무한대로 계속되는 수다. (...) N개의 상자가 있다면 상금이 얼마인지 어느 정도 알기 위해서는 적어도 e분의 N (N/e)에 해당하는 상자를 열어 데이터를 모아야 한다는 것이 수학적으로 증명되었다. (312)

파이는 익숙한데, 자연상수인 오일러 수는 지수와 로그를 배우며 접했던 이후 사용하는 빈도는 적었다. 
오일러 수가 통계적으로도 의미가 있다는 점을 알게 되었다. 

오바크는 그가 각각의 새로운 환자에게 접근하는 방식이 수학자인 내가 각각의 새로운 문제에 접근하는 방식과 크게 다르지 않을 것이라고 말했다. "잠재적인 환자에 대해 분석을 하다보면 제게 어떤 물리적인 감각이 생깁니다. 내면을 차지하고 있는 것들의 상호관계, 방어 구조... 이런저런 것에 대한 감정들이 기하학적 그림으로 떠오르는 것이죠. 이 과정에서 너무 많은 일이 일어나는데 막상 글로 써보기 전엔 그런 일들이 일어나고 있다는 사실조차 알기 어렵습니다. 이런 과정을 거쳐 지름길을 찾아내는 작업은 제가 그 과정을 무려 40년 동안 해왔기 때문에 가능한 일이기도 해요." (322~323)

모든 학문은 서로 통한다고 한다.
수학을 하든, 의학을 하든, 오랜 경험은 나름의 감각이 생긴다.
지름길을 찾아내는 일과 이 감각은 연결되어 있다. 

 

제8장 확률의 지름길

크랩 테이블 (출처:wannapik.com)

크랩 테이블craps table 게임을 예로 들어보자. 주사위 두 개로 하는 크랩 테이블에 돈을 거는 것은 게임이 가진 역동성 때문에 꽤나 복잡하다. 하지만 언제든 다음 주사위의 합이 7이 되는 것에 돈을 걸 수 있다. 앞에서 그런 경우가 일어날 확률은 여섯 번 중에 한 번이라는 사실에 대해 설명했다. 하지만 이 내기에 1달러를 걸어서 이기면 카지노는 당신의 1달러에 4달러를 얹어서 돌려준다. 공평한 게임이 되려면 카지노는 당신에게 5달러를 얹어주어야 한다. 따라서 크랩 테이블에서 7이 나오는 것에 베팅을 하는 것은 가장 최악의 선택이다. 카지노 측이 16.67퍼센트의 승률을 갖는 더 유리한 게임이기 때문이다. (336)

크랩 테이블에서 7이 나올 확률이 6분의 1이면 1달러 베팅에 이겼을 때 6달러를 받아야 한다. 
하지만 카지노는 4달러만 주기에 매번 베팅 시에 카지노가 유리한 게임이다. 

룰렛 테이블 (출처: Wikimedia Commons)

룰렛 휠은 빨간색에 돈을 걸로 빨간색이 나오면 돈을 두 배로 돌려받는 게임이다. (...) 언뜻 보기에는 별 문제가 되지 않는 것 같지만 룰렛 휠에는 약간 미묘한 부분이 있다. 휠의 36개 숫자 중에 반은 빨간색, 반은 검은색이다. 문제는 여기에 서른일곱 번째 숫자가 있다는 것이다. 이 숫자는 0이며 녹색으로 표시되어 있다. 공이 여기에 떨어지면 빨간색에 걸었든 검은색에 걸었든 플레이어는 돈을 잃는다. 이 칸은 카지노가 모두를 이기는 경우다. 얼핏 순수한 의도처럼 보이지만 카지노는 이 칸을 통해 그들의 수익을 확실히 챙길 수 있다. 적어도 장기적으로는 그렇다! (338~339)

룰렛을 해본 적이 없어 규칙을 잘 몰랐다. 
저자의 설명을 읽으며 원리를 이해했다. 
정확하게 반반이 아니라 늘 카지노가 이기는 '0'이 있다는 사실이 중요하다.

블랙잭 (출처: pexels.com)

카지노측보다 이길 확률이 조금이라도 더 높은 게임을 하려면 블랙잭 테이블에 가야 한다는 말을 들어봤을 것이다. 1960년대 미국 수학자 에드워드 소프Edward Thorp는 블랙잭 테이블에서 딜러와 다른 플레이어에게 떨어진 카드를 잘 살펴보는 것으로 카지노측보다 승률을 높일 수 있다는 것을 알아냈다. 이것을 카드 카운팅 card counting이라고 한다. 블랙잭은 21이라는 수를 넘지 않는 선에서 계속해서 카드를 받아 딜러의 점수를 이기기 위해 노력하는 게임이다. 하지만 가지고 있는 카드의 수가 21이 넘어버리는 순간 버스트bust로 판정되고 돈을 잃게 된다. (...) 영화 <21>은 MIT의 수학자들이 라스베이거스를 방문하여 소프의 전략을 적용했던 실화를 바탕으로 제작되었다. (339~340)

카지노측을 이길 수 있는 게임이 블랙잭이라고 한다. 
실제 수학자들이 카드를 살펴서 승률을 높인 사례를 보여준다. 
카지노의 세계는 확률의 세계다. 

헬렌은 기업의 과거를 살펴볼 때 역사학적 조사 방법을 동원한다. 일정한 신용 등급을 받은 특정 기업의 채권이 저평가된 것인지, 과대평가된 것인지 이해하기 위해 먼저 기업의 과거 이력들을 조사하는 것이다. 조사 과정에서 새로운 정보를 추출해 낼 수 있다면 기업에 투자하는 데 있어 남들보다는 비교 우위를 점할 수 있기 때문이다. 남들이 간과한 기업의 어떤 측면을 파악함으로써 해당 기업의 채권 가치를 평가하는 데 새로운 통찰력을 갖는 것은 일종의 예술적 경지에 해당하는 작업이다. (359)

투자의 분야에서 성공하기 위해서는 다양한 분야에 대한 이해가 도움이 된다.
헬렌은 역사학에 대한 지식을 바탕으로 기업 가치 평가에 수행했고, 통찰을 통해 성공할 수 있었다. 
수학자들이 월가에 많이 진출한다는 것은 기 알려진 사실이다. 
어쩌면 누구나 자신의 배경을 활용해서 성공적인 투자자가 될 수 있다는 의미가 아닐까.  

 

제9장 네트워크의 지름길

가우스조차도 오일러의 팬으로, 이런 말을 남기기도 했다. "오일러의 업적에 대한 연구는 수학의 모든 분야를 위한 최고의 학교 역할을 할 것이며, 그 무엇도 그것을 대체할 수 없을 것이다." (369)

이 책의 시작은 위대한 수학자 가우스로 시작한다.
하지만 후반부에서는 오일러가 등장하며 가우스조차 그의 팬이라고 한다. 
두 사람 모두 현재까지 큰 영향을 미치는 위대한 수학자들이다.

오일러는 스위스에서 태어났지만 러시아에서 활동한 인물로 박형주의 책 <배우고 생각하고 연결하고> 에서 만났다.

https://bandiburi-life.tistory.com/2500

쾨니히스베르크 다리 (출처: PICRYL)

오일러가 발견한 분석법의 장점은 이것이 쾨니히스베르크의 다리에만 적용되는 게 아니라는 것이다. 점과 선으로 연결된 모든 네트워크에서 하나의 점에서 뻗어 나오는 선의 개수가 짝수이면 한 번씩만 거치면서도 모든 점을 방문할 수 있는 경로가 반드시 있음을 증명해 보인 것이었다. 또한 연결된 선의 개수가 홀수인 점이 두 곳 있을 경우 이 점들은 여정의 시작과 마침표가 된다는 것도 밝혔다. 이러한 원리를 이용하면 지도가 아무리 복잡하더라도 분석하는 데 전혀 문제가 되지 않는다. (372)

오일러는 현실을 점과 선으로 단순화 시키고 모든 점을 방문할 수 있는지 판단 기준을 제시하고 증명했다. 
문제를 해석하기 위해 쾨니히스베르크 다리를 간단하게 표현할 수 있는 방법은 여러 공학에도 응용되고 있다. 
기계공학이나 전기전자공학 등이 유사하게 단순화된 식으로 표현할 수 있는 것도 시작은 오일러가 아니었을까. 

우리 뇌가 최고의 능력을 발휘할 때는 직관을 관장하는 뇌 영역을 이용할 때라는 사실은 밝혀낸 듯 보인다. 그래야만 해결책으로 가는 여정을 어지럽히는 너무 많은 생각을 피할 수 있기 때문이다. (396)

 

제10장 불가능의 지름길

양자물리학에서 잘 알려진 사실처럼 전자와 같은 입자는 입자가 관찰되기 전에는 두 가지 위치에 동시에 위치할 수 있다. 이런 현상을 '양자 중첩' quantum superposition이라고 부른다. 이 두 위치를 0과 1이라고 하자. 이 현상의 장점은 하드웨어가 두 배가 되지 않는다는 것이다. 전자는 하나만 있으면 되기 때문이다. 양자 중첩 현상을 이용하면 이 하나의 전자에 실제로는 하나가 아니라 두 개의 정보가 저장되는 셈이다. 이를 '큐비트' qubit'라고 한다. 기존의 컴퓨터에서는 하나의 비트는 켜짐이나 꺼짐 혹은 0이나 1 중 하나여야 한다. 하지만 이 큐비트는 병렬로 존재하는 양자 세계로 분할되어 0으로 설정된 세계와 1로 설정된 세계에 동시에 걸쳐 있을 수 있다. (427~428)

양자물리학, 양자 중첩, 큐비트 등은 양자컴퓨터를 연상시킨다.
2024년 12월 구글은 105큐비트를 탑재한 양자컴퓨터 '윌로우(Willow)'를 발표했다.
기존 수퍼컴퓨터에 비해 비교할 수 없을 정도로 빠른 성능을 가진다고 한다. 
기존 컴퓨터는 0과 1을 기반으로 한다.
이와 달리 양자컴퓨터의 큐비트는 0과 1이 여러 개 있는 것처럼 병렬로 연산 가능하다는 게 핵심이다. 

수학적 지름길의 중요한 특징은 문제를 풀기 위해 정면으로 도전하는 고난의 길을 걷고 난 후에야 황홀한 깨달음의 순간을 준다는 점이다. (440)

뭐든 고난의 연습 시간을 견디어 낸 뒤에 지름길에 이를 수 있다. 
황홀한 깨달음의 순간을 체험할 수 있다. 
이런 사실을 알기에 우리는 자신의 위치에서 오늘도 최선을 다한다.

 

728x90
반응형

댓글