데이터를 축적하는 센서와 통신 네트워크의 발달, 쌓이는 데이터의 종류와 양의 폭발적 증가, 알고리즘을 수행하는 컴퓨팅 파워의 비약적 발전, 그리고 뇌의 사고구조 이해를 알고리즘에 적용하여 인공지능이 실용성이 높아지고 있다.
[본문발췌]
이러한 진보를 가능케 하는 연료는 무한히 축적되는 데이터다. 데이터가 새로운 종류의 기름이고 학습 알고리즘이 원료 데이터에서 정보를 뽑아내는 정유공장인 셈이다. 정보는 지식을 창출하는 데 쓰일 수 있고, 지식은 이해를 이끌어내며, 이해는 지혜의 바탕이 된다.
딥러닝은 수학과 컴퓨터공학, 신경과학에 뿌리를 두고 있는 머신러닝의 한 분야다. 딥러닝 네트워크는 아기들이 자신을 둘러싼 세상을 배워나가는 것과 같은 방식으로 데이터를 통해 학습하나. 생생한 눈으로 시작해 점차 새로운 환경을 탐색하는 데 필요한 기술을 습득해나가는 아기들처럼 말이다. 딥러닝의 기원은 인공지능을 창출하는 방법에 관한 두 가지 다른 시각이 경합을 벌이던 1950년대의 인공지능 태동 시점까지 거슬러 올라간다. 하나는 로직과 컴퓨터 프로그램에 기초한 시각으로 수십 년 동안 인공지능 세계를 지배했으며, 다른 하나는 데이터로부터 직접 학습하는 방식에 기초한 시각으로 성숙단계에 이르기까지 그보다 더 오랜 시간이 걸렸다.
지능은 심리학에서 의식을 제외한 다른 어떤 주제보다 더 많이 연구되고 발표된 주제다. 의식과 지능 두 가지 모두 그만큼 정의하기 어렵다는 뜻이다. 1930년대 이후 심리학자들은 새로운 문제를 해결할 때 이전 지식에 의존하지 않고 새로운 상황에서 추론과 패턴 인식을 사용하는 유동성 지식(fluid intelligence)과 마찬가지 경우에 이전의 지식에 의존하는 결정적 지능(crytallized intelligence)을 구분해왔다. 표준 IQ 테스트가 측정하는 지능은 후자에 속한다. 유동성 지능은 발달 과정을 거치며 성년 초기 최고치에 도달하고 나이와 더불어 감소하는 반면, 결정체적 지능은 인생의 노년기에 이르기까지 천천히 점증적으로 증가한다. 알파고는 다소 좁은 영역에서 유동성 지능과 결정체적 지능 모두를 드러내는데, 해당 영역 내에서는 놀랄 만한 창의성까지 보여준다. 전문 지식이라는 것 역시 마찬가지로 좁은 영역의 학습을 기반으로 하지 않는가.
인공지능은 '무형'의 정보 경제를 가속화하고 있다. 경제적 성과의 지표는 모든 재화와 서비스를 달러화로 환산한 가치의 합계, 즉 국내 총생산(GDP)이다. 그러나 이 수치는 식품, 자동차, 의료 등 유형의 상품과 서비스를 위주로 하는 산업 경제를 위해 고안된 것이다. 그러나 정보 기업의 가치는 그런 유형의 상품으로 측정되는 경우가 점점 줄어들고 있다. 예를 들어 마이크로소프트가 소유한 건물과 장비는 고작 10억 달러에 지나지 않는다. 기업의 시장 가치의 1퍼센트밖에 되지 않는다는 얘기다. 나머지 가치는 소프트웨어와 마이크로소프트를 위해 일하는 프로그램 제작 인력의 전문성에 기인한다. 각자의 스마트폰을 통해 내려받은 정보에 어떤 가치를 부여할 수 있는가? 이제 우리에게는 모든 형태의 정보의 가치를 감안한 새로운 경제성과 지표가 필요하다. 바로 생산성의 지표 측정인 GDP를 증대시키는 국내총무형자산(Gross Domestic Intangibles, GDI)이다.
"과거의 기술은 물리학의 법칙에 기반을 두었고 20세기에 들어서는 미분방정식과 연속변수의 수학을 통해 물리적 세계를 이해할 수 있는 방법을 찾고자 했다. 시공간을 유연하게 넘나드는 수학을 통해서 말이다. 이와 대조적으로 오늘날의 기술은 알고리즘에 그 기반을 두고 있다. 21세기는 컴퓨터과학과 생물학의 복잡성 특성을 이해하는 데 이산수학과 알고리즘을 사용하는 시대다." - 브라이언 아서(W. Brian Arthir)
알고리즘은 우리가 사는 세상과 비교해볼 수 있는 복잡한 세상을 만들어낼 새로운 기회를 제공한다. 실제로 20세기에 발견된 알고리즘으로 인해 우리는 복잡성의 특성을 새롭게 조명하게 된 바 있다. 1980년대의 뉴럴 네트워크 혁명 또한 그와 유사한 성격의 시도들이 주도한 것이다. 뇌의 복잡성을 이해하기 위한 시도들 말이다. 비록 우리가 만든 뉴럴 네트워크 모데른 뇌의 뉴런 회로에 비해 상당히 단순하지만 학습 알고리즘 덕분에 방대한 뉴런으로의 정보 전달과 같은 일반 원칙에 대한 탐구가 가능해졌다. 어떻게 비교적 단순한 학습 규칙으로부터 네트워크 기능의 복잡성이 발생하는 것인가? 보다 쉽게 분석할 수 있는 복잡성을 보유한 보다 단순한 체계가 존재한다는 말인가?
현재의 마이크로프로세서 기술이라면(페타급 컴퓨팅보다 천 배 더 강력한) 엑사급 컴퓨팅을 위해서는 50메가와트의 전력이 필요하다. 뉴욕시의 지하철 운영에 필요한 것보다 더 많은 전력량이다. 따라서 차세대 슈퍼컴퓨터는 영국계 다국적 반도체 기업인 암홀딩스(ARM Holdings, ARM)에서 휴대전화기에 장착하기 위해 개발하고 최적화시킨 것과 같은 저전력 칩으로 구동되어야만 한다. 머지않아 가장 연산 집약적인 애플리케이션의 실행을 위해 범용 디지털 컴퓨터를 사용하는 것은 더 이상 실용적이지 않을 것이며 특수 목적 칩이 지배적인 상황이 도래할 것이다. 이미 휴대전화기에 지배적으로 적용되고 있는 것처럼 말이다.
인간의 뇌에는 대략 천 억 개의 뉴런이 있고 각각의 뉴런은 수천 개의 다른 뉴런들과 서로 연결되어 있어 시냅스 수는 천 조(10^15)개에 이른다. 신체의 전체 질량에서 뇌는 고작 3퍼센트만 차지하고 있음에도 불구하고 뇌의 구동에 필요한 전력은 대략 20와트 또는 몸 전체를 움직이는 데 필요함 힘의 20퍼센트 정도다. 이와 대조적으로 인간의 뇌 성능에 훨씬 못 미치는 페타급 슈퍼컴퓨터는 5메가와트 또는 25만 배나 많은 전력량을 소비한다. 자연은 분자 단위까지 신호를 전달하고 의사소통을 하기 위해 필요한 뉴런의 구성 요소들을 소형화하고 부피를 최소화할 수 있도록 뉴런들을 3차원적으로 연결함으로써(마이크로칩의 표면에 장착되는 트랜지스터는 고작 2차원적으로 연결되어 있을 뿐이다) 그와 같은 놀라운 효율성을 구현해냈다. 이 경이로운 자연의 기술은 아주 오랜 시간에 걸쳐 진화해온 것이기에 우리 인간이 만회해야 할 시간도 결코 적지 않다.
딥러닝은 고도로 연산 집약적이며 중앙 집중식 서버에서 연산을 수행하고 휴대전화기와 같은 단말 장치로 결과물을 전달하는 방식으로 운영된다. 결과적으로 단말 창치의 독립성이 관건이며 그것은 곧 근본적으로 다른 하드웨어를 의미한다. 클라우드 컴퓨팅에 비해 훨씬 가볍고 전력 소비도 훨씬 적은 하드웨어 말이다. 다행히도 그런 하드웨어가 이미 존재한다. 바로 인간의 뇌에서 영감을 얻어 고안된 뇌신경 모방 침, 일명 '뉴로모픽 칩(neuromorphic chips)'이 그것이다.
돌이켜보면, 20세기 행동에 대한 정반대의 접근법을 취했던 행동주의와 인지과학은 뇌를 배제하는 똑같은 실수를 저지른 셈이다. 행동주의자들은 내적 검증에 의해 오도되기를 원치 않았기 때문에 지침을 얻기 위해 뇌의 내부를 들여다보지 않는 것을 명예롭게 생각했다. 그드른 블랙박스의 인풋과 아웃풋을 신중하게 통제함으로써 어떤 우발적 상황에서도 행동주의적 법칙을 발견할 수 있을 것이라 믿었다. 기능주의적 인지 과학자들의 입장은 정신의 내적 표상을 발견할 수 있을 것이라 믿으며 행동주의를 거부했다. 그러나 그들 또한 뇌가 내적 표상을 어떻게 이행하는지에 관한 세부 사항들은 무관하다고 믿었기 때문에 그들이 개발한 내적 표상의 기반은 신뢰할 수 없는 직관과 민족심리학이었다. 자연은 인간보다 영리하다.
지금까지 뇌 구조로부터 얻은 새로운 기능을 추가할 때마다 딥러닝 네트워크의 기능성은 비약적으로 향상되었다. 몇 가지 사례를 들자면 피질 영역의 수직 계층 구조, 심층학습과 강화학습의 결합, 반복적 피질 네트워크에서 작동하는 기억, 사실과 이벤트에 대한 장기 기억 등이다. 우리가 배울 수 있고 최대한 활용할 수 있는 뇌의 연산학적 원리는 이 외에도 무수히 많다.
인간의 뇌는 아무것도 하지 않으면서 추상적인 생각만을 생성하는 것이 아니다. 뇌는 우리의 신체 모든 부분과 직접적으로 연결되어 있으며 다시 감각 인풋과 동작 실행기를 통해 세상과 연결되어 있다. 따라서 생물학적 지능은 그러한 관계 속에 내재되어 있는 것이다. 보다 중요한 것은 우리의 뇌가 세상과 상호작용을 하는 긴 성숙의 과정을 거쳐 발달된다는 점이다. 학습은 발달과 동시에 진행되는 과정이며 성인기에 도달한 이후에도 오랫동안 이어진다. 그러므로 학습은 일반 지능 발달의 핵심이다. 인공지능에 있어 가장 해결하기 어려운 문제 중 하나가 상식이라는 사실은 매우 흥미롭다. 어린이들에게는 현저하게 부족하고 대부분의 성인에게는 세상 속에서의 장기적 경험을 얻은 후에야 서서히 드러나는 그것 말이다. 인공지능에서 흔히 무시되는 감정과 공감 역시 지능의 필수적인 측면이다. 감정은 국부적인 뇌 상태에 의해 결정될 수 없는 뇌가 행동을 취하기 전 준비 과정에 필요한 보편적 신호다.
강화학습의 기저를 이루는 시간차 학습 알고리즘이 고도로 복잡한 행동으로 이어질 수 있고 대뇌 피질에서 이뤄지는 딥러닝에 의해 인간의 행동은 그보다 더 복잡해질 수 있다는 것을 확인한 바 있다. 자연에는 인공적 시스템이 배울 수 있는 지능적 행동의 영역이 존재한다. 컴퓨터공학과 생물학 사이에 걸쳐 있는 새로운 과학의 분야인 알고리즘 생물학에서는 생물적 체계에서 사용되는 문제 해결 전략을 설명하는 데 있어 알고리즘 언어의 사용을 추구한다. 그러한 생물학적 알고리즘이 공학 분야의 새로운 연산 인식 체계를 생성하는 데 일조하고 생물학적 네트워크에 대한 시스템 차원의 이해를 가능케하기를 희망한다. 이것은 시공간적 척도를 가로지르는 생물학적 시스템에 내포된 복잡성의 수준을 궁극적으로 설명할 수 있는 작은 시발점이다. 유전자 네트워크, 대사 네트워크, 면역 네트워크, 뉴럴 네트워크 그리고 사회적 네트워크와 그 안에 있는 모든 하위 네트워크까지 포함하는 복잡한 체계 말이다.
딥러닝은 비용함수의 최적화에 의존한다. 자연의 비용함수는 무엇인가? 진화의 정반대 비용은 적합성이다. 그러나 이 적합성은 환경적이든 또는 최적화되는 시스템으로부터든 구체적 제약 조건의 집합을 전제로 할 때 비로소 의미를 가지는 개념이다. 인간의 뇌에는 행동을 제어하는 태생적 비용함수가 있다. 예를 들면 음식, 온기, 안전, 산소, 생식에 대한 욕구가 그것이다. 강화학습에서 행동은 미래의 보상을 최적화하기 위해 취하는 것이다. 당황스러울 정도로 다양한 인간 행동의 범주를 보더라도 분명히 알 수 있듯이 생존을 보장하는 보상 이외에 다양한 범주의 보상이 최적화의 대상이 된다. 이런 다양성의 원인이 되는 근본적이 보편적인 비용함수는 존재하는 것인가?
도파민 뉴런은 뇌에서 동기부여를 제어하는 핵심 시스템을 구성한다. 인간 뇌의 도파민 뉴런은 중뇌에 있는 다수의 핵(복측피개부와 흑질)은 피질과 기저핵(선조체와 중격의지핵)으로 축색돌기를 돌출시킨다. 일시적 파열은 보상에 대한 예측과 주어진 보상 사이의 불일치를 의미하며, 이것은 행동의 선택 및 예측의 수정에 이용된다.
지각-행동 주기는 감각 데이터에 기초해 행동을 계획하는 모든 문제의 해결에 적용될 수 있다. 행동의 결과는 예측된 아웃풋과 비교될 수 있고 그 차이는 예측 시스템의 상태를 업데이트하는 데 사용될 수 있다. 또한 이전 조건에 대한 기억은 자원의 활용을 극대화하고 잠재적 문제를 예측하는 데 사용될 수 있다.
인간이 하는 학습의 대부분은 관찰과 모방에 기초한다. 우리 인간은 딥러닝이 새로운 객체를 인식하기 위해 필요로 하는 것보다 훨씬 적은 수의 사례를 필요로 한다. 비분류 감각 데이터는 넘쳐난다. 강력한 비지도 학습 알고리즘은 지도나 감독이 개입하기 전에 이런 데이터들을 유리하게 사용할지도 모를 일이다. ... 비지도 학습은 머신러닝에서 차세대 개척지와 같다. 우리는 이제 막 인간 뇌 방식의 컴퓨팅에 대해 이해하기 시작했을 뿐이다.
'4.읽고쓰기(reading & essay)' 카테고리의 다른 글
세계사를 움직이는 다섯 가지 힘 - 사이토 다카시 (0) | 2020.06.04 |
---|---|
행복의 정복 - 버트런드 러셀 (0) | 2020.06.03 |
오이디푸스 왕 / 안티고네 / 아이아스 / 트라키스 여인들 - 소포클레스 (1) | 2020.06.01 |
진보와 빈곤 - 헨리 조지 (0) | 2020.05.29 |
제주, 소요 - 비하인드 (0) | 2020.05.28 |