본문 바로가기
  • 블랜더 거실
독서습관

[253]수학의 아름다움_인공지능 빅데이터에 숨어있는 이론에 관한 책

by bandiburi 2020. 8. 1.

구글 하면 '구글링 한다'라는 동사가 있을 정도로 광고가 없는 탁월한 검색으로 유명한 회사입니다. 검색광고 수익을 시작으로 현재는 자율주행차의 웨이모, 유튜브 등으로 여러 분야에서 미래의 먹거리를 확대하고 있는 회사입니다. 구글을 포함한 애플, 마이크로소프트, 아마존, 넷플릭스 등 여러 나스닥 기업들이 Untact세상에서 더욱 빛을 발할 것이라고 생각해 주식도 지속 상승 중입니다. 

<수학의 아름다움>을 통해 우리가 사용자 입장에서 편리하다고 생각하는 모바일이나 인터넷상의 기능들이 조금만 안쪽을 들여다보면 수학을 통한 알고리즘으로 반영되어 있다는 것을 알게 되었습니다. 고등학교 수학이 어렵다고 하지만 이 책에서 나오는 벡터나 삼각함수, 행렬, 확률과 통계 등의 응용분야를 이해하고 나면 '아하 그렇구나' 이런 분야에서 사용되는 사례를 가지고 수학을 접근했다면 조금은 덜 부담스럽게, 조금은 재미있게 수학을 접하지 않았을까 생각되었습니다. 

시험을 위한 수학이 아니라 우리의 생활을 편리하게 하기 위해 효율적인 컴퓨터 알고리즘을 만들기 위한 수학이라면 충분히 즐겁게 해 볼 수 있지 않을까요? 책의 제목에 과감하게 '수학'이란 용어를 사용한 것이 많은 독자들을 망설이게 할 것입니다. 사실 책에서 소개되는 수학이론들은 맛보기지만 이해하기 어려운 부분들이 많았습니다. 그래도 구글에서 자주 사용하는 뉴스 기사, 번역, 지도 찾기 등에서 사용되는 원리와 연계해서 생각해 보는 자체가 일반 독자들에게 새로운 세상을 보도록 인도합니다. 

 

 

저자가 컴퓨터는 뉴스를 이해하지 못하고 다만 알고리즘에 따라 분류해서 독자들에게 보여줄 뿐이라는 것은 '인공지능'에 대해 과도한 기대를 품고 있는 우리에게 컴퓨터일 뿐임을 깨닫게 합니다. 컴퓨터가 사람을 능가하는 능력을 가지고 궁극적으로 사람을 지배하는 단계까지 간다는 것은 쉽지 않을 것입니다. 그 이면에 많은 석학들의 아이디어가 들어가 있는 것입니다. 

AI, 빅데이터 시대라고 합니다. 구글 등 IT 회사들과 그 기능을 사용하는 일반인들과의 괴리가 커지고 있는 세상입니다. 빈익빈 부익부가 날로 심화되고 있습니다. 만들고 리딩 하는 자와 사용하고 순응하는 자들의 차이입니다. 이 책을 통해 구글 내부에서 일어났었던 사례를 간접적으로 체험하고 그들이 왜 미국 유수의 대학에서 교수와 우수한 학생들을 서로 채용하고자 노력하는지 알 수 있습니다. 

수학을 모두 이해하려 하지 말고 이렇게 이용되는구나 정도만 알면 충분하다 생각됩니다.

다음은 책에서 남기고 싶은 문장을 인용했습니다. 


13페이지) 현대 사회는 스트레스와 조급함은 늘었지만 착실함과 자연과학의 본질에 대한 호기심, 지식 탐구는 줄었다는 생각이 든다. 

31) 초기 인류는 이해하고 전달해야 하는 정보가 적었기 때문에 언어와 숫자가 필요하지 않았다. 점차 인류가 진보하고 문명화가 진행되면서 표현해야 하는 정보도 많아졌고, 몇 가지 소리만으로 감당할 수 없게 되면서 언어가 생겼다. (중략)

 언어와 어휘가 어느 정도까지 많아지자 두뇌에만 의지해선 모든 어휘를 기억할 수 없게 되었다. 모든 지식을 기억해내는 사람이 없는 것처럼 말이다. 그래서 정보를 효율적으로 기록해야 할 필요성이 생겼고, 이것이 바로 문자의 기원이다. 

41) 상형문자에서 표음문자로의 이행은 비약적인 발전이었다. 인간이 사물을 설명하는 방식이 사물의 외관에서 추상적인 개념으로 진화했고, 알게 모르게 정보에 대한 코딩을 적용했기 때문이다. 그뿐만 아니라 우리 조상의 문자 코딩은 매우 합리적이었다. 

 

 

121) 정보이론에 관심이 있고 수학 기초가 있는 독자라면 스탠퍼드대학교 토머스 커버(Thomas Cover) 교수의 저서 <정보이론의 기초 Elements of Information Theory>를 읽어보기 바란다. 커버 교수는 현재 가장 권위 있는 정보이론 전문가다.

122) 물질주의가 팽배한 지금 중국 사회에서 학술계는 경박하고 젊은이들은 불안감이 커서 원대한 뜻을 품은 젊은이들은 실제 매우 고독하다. 프랑스 소설가 로맹 롤랑 Romain Rolland이 그린 제1차 세계대전 이후의 프랑스와 닮아 있다. 로맹 롤랑은 풍족한 물질보다 고상한 영혼을 추구하는 젊은이들이 거인의 숨결을 느낄 수 있도록 거인 전기 3부작을 썼다. 나 또한 뜻을 세운 학생들에게 대가 몇을 소개하고 있다. 프레더릭 젤리넥부터 시작해보자. 

 <베토벤의 생애> <미켈란젤로의 생애> <톨스토이의 생애>

124) 프레드와 나는 각자 소년 시절의 교육을 얘기할 때면 몇 가지 동의하는 관점이 있다. 첫째, 초등학생과 중고등학생은 사실 공부에 많은 시간을 쏟을 필요가 없다. 그들의 사회 경험, 생활력과 학창 시절에 세운 뜻이 그들의 평생을 도와줄 것이다. 둘째, 중고등학교 단계에서 또래보다 많은 시간을 들여 더 많이 공부한 내용은 대학에 진학하면 짧은 시간에 끝낼 수 있다. (중략) 셋째, 공부(와 교육)는 평생 계속되는 과정이다. 중고등학교 때 성적이 우수한 아시아계 학생이 명문대에 들어가면 재미로 공부하는 미국 학생들보다 한참 뒤떨어지는 경우를 많이 본다. 아시아계 학생은 공부를 지속할 동력이 부족하기 때문이다. 넷째, 책의 내용은 일찍 배워도 되고 늦게 배워도 되지만 성장 단계는 놓치면 메울 길이 없다

133) 여러 해 전 내게 공부는 평생 하는 일이라고 말해준 적이 있는데, 젤리넥은 정말로 그렇게 했다. 

136) 검색을 잘하기 위한 가장 기본적 요건은 매일 10~20개씩 형편없는 검색 결과를 분석하는 것이다. 그렇게 한동안 쌓아나가면 감각이 생긴다. 

 

 

140) 현대 물리 연구 성과에 따르면 우리 세계는 확실히 연속적이지 않고 양자화되어 있다. 우주의 기본 입자는 개수가 유한하며 구골(googol, 10^100)보다도 훨씬 적다. 

154) 이 우선순위 정렬을 관리하는 서브 시스템을 일반적으로 스케줄러라고 하며, 한 페이지의 다운로드가 끝난 후 다음에 어떤 페이지를 다운로드할 것인지를 스케줄러가 결정한다. 

159) 인터넷에서 한 웹페이지가 다른 웹페이지들에 링크되어 있다는 것은 그 페이지가 보편적으로 인정받고 신뢰받는다는 의미다. 그러면 그 페이지는 높은 순위에 랭크된다. 이것이 페이지랭크의 핵심 개념이다. 

190) 먼저 사용자 문제 80%를 해결한 후 나머지 20% 문제를 서서히 풀어가는 싱할의 일 처리 철학은 산업계에서의 성공 비결 중 하나다. 수많은 실패는 사람이 우수하지 못해서가 아니라 일 처리 방법이 잘못된 데서 기인한다. 

193) 싱할은 매일같이 바람직하지 않은 검색 결과 사례들을 분석해 1차 자료를 확보했고, 구글 펠로가 된 후에도 이 작업을 꾸준히 했다. 

203) 미국인은 기계(컴퓨터)로 사람의 작업을 대체해 임무를 완수하는 경향이 있다. 단기간 내에 시간 외 근무를 해야 하지만 장기적으로 보면 많은 시간과 비용을 절약할 수 있다. 

205) 중학교 국어 수업 시간과 대학교 영문학 수업 시간에 선생님들은 늘 독해를 할 때 첫 단락과 마지막 단락 그리고 매 단락의 첫 문장에 특별히 주의를 기울이라고 강조한다. 이 규칙은 자연어 처리에서도 유용하다. 

222) 동영상 매칭에는 키 프레임(key frame) 추출과 특징 추출, 두 가지 핵심 기술이 있다. MPEG 동영상(NTSC 방식 디스플레이에서 재생)은 1초당 영상이 30 프레임이지만 프레임들 간의 차이가 크지 않다. 일반적으로 1초 혹은 수초에 한 프레임이어야 온전한 영상이며, 이런 프레임을 키 프레임이라고 한다. 

 
 

233) 야들리는 미국으로 돌아간 후 <중국의 블랙 체임버 The Chinese Black Chamber>라는 책을 써서 그동안의 경험을 소개했지만, 이 책은 1983년에야 보안 해제를 허가받아 출간했다. 

254) 이런 생산 방식은 나일강 하류에 토지를 관개할 홍수가 없어진 1960년대까지 이어졌다. 나일강에 아스완 하이댐(Aswan HIgh Dam)이 축조되었기 때문이다. 시리우스와 태양의 동시 출현을 기준틀(reference frame)로 삼는 것이 태양계만 기준틀로 삼는 것보다 더 정확하다는 점이 사실로 판명되었다. 

255) 수학자와 천문학자로서 프톨레마이오스는 많은 발명과 공헌을 했고, 그중 하나만으로 과학 역사상 중요한 인물로 자리매김하기 충분하다. 

269) 그곳에서 델라 피에트라 형제는 과학자들이 최대 엔트로피 모델과 다른 선진적인 수학 툴을 이용해 주식 동향을 예측하기 시작하면서 큰 성공을 거뒀다. (르네상스 테크놀로지사 이야기)

391) 따라서 개인 투자자가 정말 데이터를 가지고 말할 수 있다면 인덱스 펀드를 사라는 투자 의사결정 지침 하나만 따르면 된다. 

413) 미래 세상에서 우리 삶은 점점 더 데이터를 벗어날 수 없게 될 것이고, 데이터 수집 및 처리와 관련한 업무 기회가 끊임없디 쏟아질 것이다. 또 데이터 처리 및 활용 방법을 터득한 사람이 새로운 시대의 승자가 될 것이다. 일반화하면 어떤 분야에서든, 어떤 업무에 종사하든 데이터의 중요성을 이해하고 업무에서 데이터를 잘 활용하는 사람이 성공할 가능성이 더 높다. 

422) 영국의 저명한 물리학자 스티븐 호킹의 <짧고 쉽게 쓴 '시간의 역사' A Brief History of Time>다. 호킹은 심오한 우주학 원리를 아주 간단한 언어로 풀어냈고, 이 과학 대중서는 전 세계 베스트셀러가 되었다. 그리고 내게 영향을 준 프로그램은 바로 유명한 미국 배우 모건 프리먼이 내레이션 및 진행을 맡은 <웜홀을 통해서 Through the Wormhole>다.


독서습관253_인공지능 빅데이터에 숨어있는 이론에 관한 책_수학의 아름다움_우쥔_2019_세종서적(200730)


■ 저자: 우쥔

구글 초창기 연구원이자 자연어 처리 및 정보 검색 전문가, 칭화대학교를 졸업하고 존스홉킨스대학교에서 컴퓨터공학으로 박사 학위를 받았다. 구글에서 세계적인 검색 전문가 아밋 싱할(Ait Singhal)과 함께 인터넷 검색 스팸방지 기술을 개발해 구글 공학상을 받았으며, 자연어 분석기와 한중일 검색 알고리즘을 설계하는 등 구글에서 많은 연구 프로젝트를 수행했다. 2010년부터 2년간 중국 IT 기업 텐센트 검색 및 검색광고를 총괄하는 부사장을 지냈으며, 2012년 구글로 복귀해 차세대 검색 분야인 구글 자동 QA 시스템을 개발하고, 2014년에는 벤처기업 투자에 뛰어들어 실리콘밸리 아미노 캐피털을 설립했다. 

국가 인간 컴퓨터 언어 지적 대화 컨퍼런스(National Human-Computer Voice Intelligent Interface Conference)에서 수여하는 최우수 논문상과 유로 스피치에서 수여하는 최우수 논문상을 받았으며, 미국 특허와 국제 특허 10여 건을 취득했다. 저서로는 <흐름의 정점>(란스쯔 2011년 10대 경제경영서상), <문명의 빛>(2014년 중국의 좋은 책), <스마트시대 무엇부터 해야 하나>가 있다. 
728x90
반응형

댓글