• CNN을 이용한 한국어 문장 분류

    문장을 분류하는 기술은 기존 머신 러닝의 네이브 베이즈(Naive Bayes)와 서포트 벡터 머신(Support Vector Machine)이 널리 쓰여왔다. 특히 서포트 벡터 머신은 비교적 간편한 방법으로 고성능의 분류를 수행할 수 있어 딥러닝 이전까지 널리 쓰였다. 여기서는 서포트 벡터 머신의 성능을 뛰어 넘는 딥러닝 알고리즘인 합성곱 신경망(Convolutional Neural Networks / CNN / ConvNets)을 이용하여 한국어 문장 분류를 진행하고, 과정을 정리하여 소개해 보도록 한다.
  • 웹 성능 측정 도구 carrotw 소개

    이 글은 작년에 사내에서 진행했던 웹 성능 측정 도구 carrotw를 소개하는 글이다. 성능 측정 도구인 만큼 DoS 툴에 가까워 악용될 우려가 있고, 사내 전용이라 외부에 서비스를 공개할 수는 없지만 어떤 원리로 구현되었는지 기술을 소개하는 것은 의미가 있다고 생각하여 정리하여 소개해보도록 한다.
  • 시니어 개발자의 조건

    평소 좋은 개발자란 어떤 사람인지에 대해 고민이 많다. 특히 한해 한해 나이를 먹어가면서 시니어 개발자란 과연 어떤 사람을 말하는지에 대해 고민을 많이 하고 있다. 말콤 글래드웰의 얘기처럼 1만 시간을 채우면 누구나 좋은 시니어가 될 수 있을 것인지. 그렇지 않다면 다른 필요한 것은 무엇인지 여러가지 주제로 구분하여 함께 살펴보도록 한다.
  • Apache와 Nginx의 PHP 성능 비교

    이벤트 방식인 Nginx 는 프로세스/쓰레드 방식인 Apache 에 비해 월등한 성능을 보이는 것으로 알려져 있다. 실제로 Static 파일들 CS, JSS 의 경우엔 두드러져 보이는데, 그렇다면 CGI 도 이에 해당되는지 특히 PHP 의 경우를 예로 들어 살펴본다.
  • URL 자동 변환 아파치 모듈

    오래된 URL을 신규 URL로 자동으로 변환해주는 아파치 모듈을 만들어 레거시 코드의 수정 없이 신규 URL로 리다이렉트 하여 개발 생산성을 높여보도록 한다.
  • 문자열 검색: Boyer-Moore 알고리즘

    보이어-무어 알고리즘을 이용해 문자열 검색 기능을 만들어 본다.
  • 검색 엔진 프로토타이핑

    검색 엔진을 만들었다. IIR 책을 보면서 이론을 직접 구현해봐야겠다는 생각에 주말에 짬을 내어 코딩을 시작했다. 마침 비가 내려 밖으로 운동 하러 나갈 수도 없었고 이쁜 꼬맹이 친구가 집에 놀러와 다소 여유도 생겼다.
  • 나쁜 문서에 대해

    사내 위키를 들여다보며, 안타깝게도 기대 이하 수준을 보이는 문서가 많다. 나쁜 문서를 보면서 공통된 특징을 찾아 몇 가지 언급해본다.
  • CONTEST Mock TCP 서버

    TCP 클라이언트가 보내는 메시지와 커넥션을 모니터링하는 서버를 만들어 TCP Listen이 정상인지, 어떠한 메시지를 주고 받는지 상세히 들여다 보면서 디버깅 할 수 있도록 한다.
  • TIME_WAIT 상태란 무엇인가

    TIME_WAIT 상태가 늘어나면 서버의 소켓이 고갈되어 커넥션 타임아웃이 발생한다는 얘기를 한다. 이 말이 올바른 얘기인지, TIME_WAIT은 어떠한 경우에 발생하고 어떤 특징이 있는지 살펴본다.
is a collection of Papers I have written.
© 2000 - Sang-Kil Park Except where otherwise noted, content on this site is licensed under a CC BY-NC 4.0.
This site design was brought from Distill.