인공지능

역사

  • 퍼지이론fuzzy theory: 1965년 버클리의 자데(L.A. Zedeh)가 퍼지집합(fuzzy set) 논문에서 소개. 불분명한 상태, 모호한 상태를 참 혹은 거짓의 이진 논리에서 벗어난 다치성으로 표현하는 논리 개념(위키피디어). 규칙 기반 기술.
  • 생성 시스템Production System: 1970년대 초반 CMU의 뉴웰과 사이먼(Newell, Simon)이 현대의 규칙 기반 전문가 시스템의 기초가 된 생성 시스템 모델 제안
  • 전문가 시스템 Expert System: 지식 베이스 시스템이라고도 하며, 생성 시스템의 하나로 특정 분야에 대한 전문 지식을 정리하고 표현하여 활용

탐색 Search

문제 해결 Problem Solving은 문제 공간 Problem Space의 탐색 Search으로 흔히 설명된다. 상태 공간 탐색 State Space Search

상태공간 그래프의 암시적인 implicit 표현의 세 가지 기본 요소

  1. 시작 노드의 표현(출발 상태들의 조합) initial state
  2. 하나의 상태를 나타내는 표현을 어떤 행동에 대한 결과 상태를 나타내는 표현으로 바꿔주는 함수, 연산자 operator(연산자들의 조합)
  3. 목표 조건 goal condition(목표 상태의 조합)

(State Space)

크게 두 종류의 탐색 방법이 있다.

  1. 무정보 uniformed or blind 탐색: 목표까지의 경로를 찾는 데 있어서 탐색공간의 어떤 한 부분을 다른 부분에 비해 선호할 만한 판단 근거가 없는 경우에 사용하는 방법. bfs, dfs. 최적경로탐색: 균일비용방법 UCS; Uniform Cost Search Dijkstra Algorithm을 이용한 탐색. 가장 적합한 데이터 구조는 Priority Queue. Priority Queue는 Heap으로 저장 가능. (균일 비용 탐색)
  2. 경험적 heuristic 탐색: 탐색을 한 부분에 집중시킬 수 있도록 해주는 그 문제 고유의 정보가 있는 경우에 사용하는 방법 (Nils J.Nilsson, 1998) 언덕 오르기 방법 Hill Climbing, 최적우선 방법 Best-first Search. 최적경로탐색: A* 알고리즘

The British Museum algorithm(BMA; 박물관 알고리즘) is a general approach to find a solution by checking all possibilities one by one, beginning with the smallest. 탐색 영역이 작은(축소될 수 있는) 문제에는 유용할 수도 있다. 무한 원숭이 정리Infinite monkey theorem

탐색 문제의 종류:
퍼즐, 틱택토, TSP, 강건너기

문제축소 Problem Reduction

문제를 여러 개의 작은 부분으로 분해하여 이들 부분적인 문제에 대해 각각 풀이를 얻은 후, 이것들을 하나로 결합하면 원래 풀고자 하는 문제의 풀이를 얻을 수 있는 종류 divide and conquer e.g. 하노이 탑 문제
AND-OR 그래프 사용: 문제축소의 과정을 트리구조의 한 형태로 나타낸 것

지식 공학

지식을 습득, 표현, 이용하는 각각의 영역을 추론하는 컴퓨터에 어떻게 이식시킬 것인가 연구하는 학문 (지식공학이란?)

지식공학의 연구과제

  1. 지식 습득
  2. 지식 표현
  3. 지식 이용

패턴 인식

시스템의 구조 설명

  1. 관측의 입력
  2. 전처리
  3. 분할

시스템 설계 5단계

데이터 수집 - 특징 선택 - 모델 선택 - 학습 - 인식

접근 방법

  • 통계적 접근법
  • 신경망 접근법
  • 구조적 접근법: 패턴의 구조적인 유사성을 조사하여 분류하는 방법

지식 표현 Knowledge Representation

지식 표현의 조건 Requirements of a Knowledge Representation

  • 표현 방법의 적합성(기술능력) Representational Adequacy
  • 추론의 적합성(문제해결능력) Inferential Adequacy
  • 추론의 효율성(추론능력) Inferential Efficiency
  • 지식 획득 능력(습득능력) Acquisitional Efficiency

(IAI : Knowledge Representation)

지식 표현의 유형

  • 절차적 지식
  • 선언적 지식

논리를 이용한 지식 표현

  • 명제 논리 Propositional Logic
    논리 연산자를 통해 명제들을 연결. 변수를 사용할 수 없고, 다양한 사실을 참 또는 거짓으로만 표현하는 어려움
  • 술어 논리 Predicate Logic
    술어와 객체로 표현. 객체 상호간의 관계를 효율적으로 묘사한다는 장점

명확하게 정의된 추론 규칙을 이용해서 이미 참으로 알려진 사실로부터 새로운 사실을 유도하는 과정에서 주로 쓰인다. (인지 6장 지식의 표현 방법)

규칙을 이용한 지식 표현

규칙: 조건(IF)과 결론(THEN)으로 이루어진 문장 표현
전방향 추론, 후방향 추론이 있다.

그래프를 이용한 지식 표현

그래프로 지식을 표현하면 다른 형태보다 전체적인 지식의 모습을 조망하기 쉽다. (지식표현)

의미망 기반 지식 표현

Semantic Net, 네트워크를 기초로 한 지식표현 (의미망의 예)

프레임을 이용한 지식 표현


(AITA : Frame Based Systems)

Marvin Minsky가 1974년에 발표, 객체의 속성을 상속할 수 있다. 나중에 객체지향 개념으로 발전

생성 시스템 Production System

(인공지능의 기법과 응용 p.219 ~ 245, 김재희, 1988) (source)
생성 규칙 production rule을 바탕으로 지식 표현. 전문가 시스템 experts system도 생성 시스템의 일종.

구성요소

  1. 생성 규칙들의 모임인 생성 메모리 production memory
  2. 현재 상태를 나타내는 버퍼 buffer, 비슷한 데이터 구조로서의 작업 메모리 working memory, context
  3. 시스템의 운영을 관장하는 인터프리터 interpreter

생성 시스템의 선택 및 운영

생성 시스템의 선택 및 운영 시 고려해야 할 점

  1. 생성 규칙의 복잡성
  2. 충돌 해결 conflict resolution
  3. 운영, 전향 forward, 후향 backward 두 가지 방향으로 운영
  4. 추론 과정에 대한 설명 능력
  5. 지식 전달 knowledge transfer
  6. 확신율 certainly factor에 의한 답변의 신뢰성

생성 시스템의 장단점

  1. 모듈성 modularity
  2. 균일성 unformity
  3. 자연스러움 naturalness
  4. 비효율성

    규칙의 강한 모듈성과 균일성이 문제 풀이에 사용될 때는 많은 비용을 지출하게 된다. 생성 시스템은 매치-행동(match-action) 주기에 의하여 수행된다. 생성 시스템은 개별적인 상황에 대하여 행동을 부여하는 생성규칙에 의하여 구성되므로, 미리 정해진 일련의 상황에 대치하거나 혹은 일련의 상황의 요구시, 보다 큰 단계의 추론은 불가능하거나 상당히 비효율적이게 된다. (규칙과 생성 시스템)

  5. 명확성 부족: 문제풀이에서 제어의 흐름을 추적하기가 어려움

응용분야

  1. 지식이 많은 사실들로 구성되어 널리 퍼져 있는 분야, 의료분야
  2. 문제의 처리 과정이 독립된 행위의 모임으로 표현될 수 있는 분야, 의료의 환자 검사 시스템 분야
  3. 사용하는 법으로부터 쉽게 구분되는 지식을 이용하는 분야, 생물학에서 사용되는 분류학적 분류법

전문가 시스템 Expert System

  • DENDRAL: 스탠포드 Edward A. Feigenbaum, 1971. 화학 분자식과 질량 스펙트럼을 입력시키면, 그 물질의 가장 가능성이 높은 화학구조식을 출력하는 프로그램
  • MYCIN: 세계 최초로 성공한 전문가 시스템, 1970년대 중반 스탠포드에서 개발. 의사의 세균성 질병 진단 도움.
  • PROSPECTOR: 지질학 전문가. 광상이 어떤 특별한 지역에서 발견될수 있는 가능성을 예측. 석유, 천연가스, 헬륨의 발견 예측 포함.

How Expert Systems Work

지식 베이스 The Knowledge Base

  • 대상 Object
  • 속성 Attribute

대상이 그 속성을 갖는다 has, 갖지 않는다 has not로 정의

추론 기관 The Inference Engine

  • 결정적 deterministic
  • 확률적 probabilistic

추론 기관을 구성하는 세 가지 방법

  • 전진 연쇄 방법 The Forward-Chaining Method: data-driven. 대상물 object이 종단 지점에 도달할 때까지 논리 AND, OR들의 네트워크를 통해 이동. leaf → root. 귀납법과 유사
    (대상물 사과를 향한 전진연쇄 방법)
  • 후진 연쇄 방법 The Backward-Chaining Method: 가설 hypothesis을 갖고 시작하여 확신하거나 부정하기 위한 정보 요구. object-driven. 가설을 명제로 비유한다면 연역법과 유사.
  • 규칙값 방법 The Rule-Value Method
    시스템으로부터 불확실성이 가장 큰 것을 제거할 (remove the most uncertainty from the system) 정보를 다음 정보로서 시스템이 요구.

    규칙값 접근 방식을 이해하기 위해, 아이가 아파서 의사를 불렀다고 생각해보자. 의사는 먼저 아이가 열이 있는지를 묻는데, 이것은 이 질문에 대한 많은 가능성의 수를 줄이기 때문이다. 당신이 “예” 하고 대답하면, 의사는 당신에게 아이가 구토를 느끼는 지를 묻는다. 첫 번째 질문에서처럼, 의사는 현재 상태가 주어져 있을 때 그 대답이 진단에 가장 큰 영향을 미치기 때문에 다른 질문들보다 이 질문을 한다. 이 과정은 의사가 진단을 할수 있을 때 까지 계속된다. 이 예에서, 중요한 점은 의사가 결론까지 가장 빠르게 이를 질문들을 선택한다는 것이다. (전문가 시스템)

Decision Tree에서 Entropy를 낮추고 Information Gain을 높일 수 있는 Greedy로 동작하는 것과 유사. 모든 것이 동일할 경우 후진연쇄 방법이 구현하기 쉽다. 전문가 시스템이 등장했던 1970년대는 아직 ID3 알고리즘(1986)이 등장하기 이전이므로 전진/후진 연쇄 방법을 사용. 현재는 DT를 이용한 접근이 많이 보인다.

유전자 알고리즘 genetic algorithm, GA

(Holland, 1975; Goldberg, 1989) (NLP로 유명한 Yoav Goldberg가 아님)
이 최적화 방안은 집단 생물학에서는 진화 이론을 기반으로 하며, 복잡한 다변량 함수에서 최적의 해법을 찾는데 효과를 보여왔다. (p.568 실전 예측 분석 모델링, 2013, 2018)

에이전트

에이전트라는 용어가 사용되기 시작한 것은 1980년 MIT에서 개최된 분산 인공지능에 관한 첫 번째 워크숍 이후.

에이전트의 종류

  • 반응형 에이전트: 기호 symbol 대신 실세계에서 센서를 통해 감지한 신호 그 자체를 처리
  • 숙고형 에이전트: 환경과 추구하는 목표 그리고 가능한 행동들에 대한 명시적인 기호 모델을 가지고 이 모델을 바탕으로 논리적 추론을 전개함으로써 현재 자신이 수행해야 할 행동을 결정
  • 계획 수립 에이전트: 상태 스키마, 연산자, 상태공간 그래프, 그래프 탐색의 개념을 이용
  • 웹 에이전트: 서버에 상주하면서 사용자와 직접적인 상호작용 없이 사용자를 대신해서 작업을 수행하도록 인터넷 상에서 분산된 온라인 정보에 접근하는 컴퓨터. 여기서는 크롤러를 말하는 것 같다.
  • 모바일 에이전트: 한 클라이언트 컴퓨터에서 디스패치하여 원거리에 있는 원격 서버로 이동하여 실행하는 독립된 하나의 프로그램을 의미.
    특징: 자율성, 비동기적 작업. 에이전트 자신의 복제를 통해 다른 서버로 이동. 필요 정보 수집

기타

신경세포 작동 메커니즘

(지능의 탄생, 2017)

신경세포는 크게 세 종류로 나뉜다. 감각신경세포 sensory neuron는 빛, 공기 움직임 등 외부 자극을 전기적 신호로 변환. 운동신경세포 motor neuron는 근육의 수축 내지 이완을 위해 전기적 신호 전달. 중간신경세포 interneuron 감각신경세포와 운동신경세포를 연결. 인간을 포함한 모든 동물의 의사결정이란 이렇게 세 가지 종류의 신경세포를 조합함으로써 외부로부터 들어오는 자극에 대해서 적절한 형태의 행동을 유도하는 과정이라 볼 수 있다.

기억률

(source)

참여적 학습방법 Participatory Teaching Method 일때 평균기억률이 훨씬 더 높다. (메모 독서법, 2019)

(source)

독일의 심리학자 에빙 하우스 Hermann Ebbinghaus의 망각 곡선. 원래는 보유 곡선 retention curve라고 불렀다. 초반에는 급격하게 잊어버리지만 시간이 지날수록 점점 잊어먹는 속도가 느려져서 결국에는 거의 잊어먹지 않는 장기 기억이 된다. (나무위키)

(나무위키)

꾸준한 재학습으로 망각 속도를 느리게할 수 있다.


2017 Book Reports · 2018 Book Reports · 2019 Book Reports · AWS · Activation, Cost Functions · CNN, RNN · C++ · Decision Tree · Docker · Go · HTML, CSS, JavaScript · Hadoop, Spark · Information Retrieval · Java · Jupyter Notebooks · Keras · LeetCode · LifeHacks · MySQL · NLP 실험 · NLP · Naive Bayes · OAuth 2.0 · OOP · Python Data Structure Cheatsheet · Python · RSA · Software Deployment · Support Vector Machine · Word Embedding · XGBoost · Scikit Learn · 거리 · 데이터 마이닝 · 데이터 사이언스 · 딥러닝 · 머신러닝 분류기 · 머신러닝 · 비지니스 · 사회심리학 · 수학 · 알고리즘 · 영어 · 운영체제 · 이산수학 · 인공지능 · 자료구조 · 진화생물학 · 컴파일러 · 컴퓨터시스템구조 · 통계학 응용 · 통계학 ·
is a collection of Papers I have written.
© 2000 - Sang-Kil Park Except where otherwise noted, content on this site is licensed under a CC BY-NC 4.0.
This site design was brought from Distill.