지능형 정보검색 에이전트(Intelligent Information Retrieval Agent)

인터넷 환경에서 기본 정보 검색 엔진에 관한 연구는 많이 진행되어 있고 이미 상품화되었왔다. 그러나 자연언어, 음성 대화, 다중 모드를 기반으로 하는 지능형 인터페이스와 지능형 분산 에이전트 모델, 그리고 병렬 검색 연구와 같이 기본 정보 검색 엔진에 사용자에게 보다 편리하고 부가적인 기능을 갖추도록 하는 지능형 초고속 웹 검색 시스템을 개발하기 위한 기초 연구가 필요하다.
 

멀티 에이전트 시스템 모델링

분산 인공지능 분야에서 시작된 멀티에이전트 시스템은 각 에이전트들이 주어진 부분 문제를 독립적으로 해결하고, 에이전트들 사이의 상호 작용 및 조정을 통해 복잡한 전체 문제를 해결하는 시스템이다.

본 연구에서는 지능형 정보 검색 시스템 구축의 기반이 되는 멀티 에이전트 시스템에 관한 연구 수행하고자 한다.

멀티에이전트 관련 link

  • UMDL   미시건 대학의 전자 도서관 시스템.
  • UMASS CIG Searchbots   지능형 에이전트들이 분산 환경에서 병렬적으로 정보 수집.
  • ICMAS'98  International Conference on Multi Agent Systems, Paris, France, July 4 - 7, 1998
  • ICMAS'2000  The Fourth International Conference on Multi Agent Systems, July 7-12, 2000, Boston MA, USA

사용자 모델링

사용자 모델링이란, 한 시스템이 자신의 목적을 보다 효과적으로 수행할 목적으로 사용자의 독특한 행동들을 파악해 나가는 과정이다.

사용자 프로파일을 이용한 모델링

  • 사용자로부터 사용자 정보가 입력되면, 사용자의 성별, 나이, 사는 지역등의 정보를 바탕으로 사용자를 분류
  • 프로파일 관리자는 사용자의 선호도를 바탕으로 검색 결과의 순서를 조정하거나 불필요한 정보를 제거한 후 여과된 정보를 사용자에게 출력
  • 사용자는 여과된 정보를 보고 만족도에 따라 적절한 피드백을 프로파일 관리자에게 보내면, 프로파일 관리자는 사용자의 선호도를 학습
 

사용자 모델링 관련 link

 

BK21 사업 관련 연구 논문 LIST

정보과학회


[개인저자] 송용수 서강대학교 컴퓨터학과
[공저자] 홍언주 한국관광대학 디지털콘텐츠과 오경환 서강대학교 컴퓨터학과
[원문제목] 사용자의 결합된 행동을 이용한 적응형 정보여과 에이전트 An Adaptive Information Filtering Agent based on User′s Combined Behaviors
[원문수록처] 2002봄 학술발표논문집(B):Proceedings of The 29th KISS Spring Conference(한국정보과학회) 2002.04 pp.268-270
[발행연도] 2002
[저널명] 2002봄 학술발표논문집(B):Proceedings of The 29th KISS Spring Conference(한국정보과학회)
  본 논문에서는 온라인 뉴스 기사를 여과하여 사용자에게 관련있는 뉴스기사만을 선별적으로 여과하여 보여주는 정보여과 에이전트를 설계 및 구현하였다. 정보여과의 핵심이라고 할 수 있는 정확한 사용자 프로파일 구축과 정보에 대한 사용자의 적합성 반응인 명시적 피드백과 암시적 피드백을 모두 결합한 피드백을 사용하여 사용자 프로파일을 좀 더 정교하게 구축하는 방법을 기술하였다. 실험을 통하여 사용자의 결합된 적합성 피드백 행동에 기반한 정보여과 에이전트의 성능이 단일의 피드백만을 사용했을 때보다 더 좋은 정확성과 적응성을 지니고 있음을 보여 주었다.

 

[개인저자] 전성해 서강대학교 컴퓨터학과
[공저자] 오경환 서강대학교 컴퓨터학과
[원문제목]

MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석 Sparse Web Data Analysis Using MCMC Missing Value Imputation and PCA Plot-based SOM

[원문수록처] 2003 학술발표논문집(D):VOL.   10-D NO.   02 pp.   0277   ~   0282   2003 . 04
[발행연도] 2003
[저널명] 2003한국정보처리학회 논문지 D
  웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다.

 퍼지학회

 

[개인저자] 이상훈 서강대학교
[공저자] 박정은 서강대학교, 오경환 서강대학교
[원문제목] 데이터 분포를 고려한 연속 값 속성의 이산화
[원문수록처] 한국퍼지및지능시스템학회 논문지    2003년    13권   4호    391 - 396
[발행연도] 2003
[저널명] 한국퍼지및지능시스템학회 논문지  2003년    13권
  본 논문에서는 특정 매개변수(parameter)의 입력 없이 속성(attribute)에 따른 목적속성(class)값의 분포를 고려하여 연속형
(continuous) 속성 값을 범주형(categorical)의 형태로 변환시키는 새로운 방법을 제안하였다. 각각의 속성에 대해 목적속
성의 분포를 1차원 공간에 사상(mapping)하고, 각 목적속성의 밀도, 다른 목적속성과의 중복 정도 등의 기준에 따라 구간
을 군집화 한다. 이렇게 생성된 군집들은 각각 목적속성을 예측할 수 있는 확률적 수치에 기반한 것으로, 각 속성이 제공
하는 정보의 손실을 최소화 하는 이산화 경계선을 갖고 있다. 제안된 데이터 이산화 방법의 향상된 성능은 C4.5 알고리즘
과 UCI Machine Learning Data Repository 데이터를 사용하여 확인할 수 있다.

 

[개인저자] 박민재 서강대학교
[공저자] 전성해 서강대학교, 오경환 서강대학교
[원문제목] 붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정화
[원문수록처] 한국퍼지및지능시스템학회 논문지    2003년    13권   1호    12 - 17
[발행연도] 2003
[저널명] 한국퍼지및지능시스템학회 논문지    2003년    13권  
  데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는
초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경
험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된
군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해
유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단
내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정
되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다.
그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다.

 

[개인저자] 박민재 서강대학교
[공저자] 전성해 서강대학교, 오경환 서강대학교
[원문제목] 붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정화
[원문수록처] 한국퍼지및지능시스템학회 논문지    2003년    13권   1호    12 - 17
[발행연도] 2003
[저널명] 한국퍼지및지능시스템학회 논문지    2003년    13권  
  데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는
초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경
험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된
군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해
유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단
내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정
되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다.
그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다.

 

[개인저자] 전성해 서강대학교
[공저자] 정성원 서강대학교, 오경환 서강대학교
[원문제목] 모바일 컴퓨팅 환경에서 협업추천 모형을 이용한 캐시 적재 기법
[원문수록처] 한국퍼지및지능시스템학회 논문지    2004년    14권   6호    687 - 692
[발행연도] 2004
[저널명] 한국퍼지및지능시스템학회 논문지    2004년    14권
  본 논문은 낮은 대역폭, 장시간의 지연, 그리고 잦은 네트워크 단절로 인한 정보 서비스 공백에 대한 모바일 컴퓨팅 환경
의 문제점들을 해결하기 위하여 협업추천 모형에 의한 효과적인 캐시 적재 기법을 제안하였다. 효과적인 캐시 적재가 모바
일 클라이언트의 이러한 문제점들을 해결하기 위한 적절한 방법이 된다는 기존의 연구는 많이 진행되어 왔다. 하지만 모바
일 컴퓨터의 요구에 대한 이력 정보만을 이용한 기존의 연구는 모바일 클라이언트가 필요로 하는 모든 정보 요구를 만족
하지 못하였다. 특히 저장 공간의 제약을 갖는 모바일 컴퓨터의 한계 때문에 더욱 큰 어려움을 갖게 되었다. 본 연구에서
는 모바일 클라이언트의 이력 정보에 대하여 협업추천 모형을 적용한 캐시 적재 기법을 제안하여 적은 캐시 용량만으로도
모바일 클라이언트의 정보 요구를 만족하는 아이템들을 서비스할 수 있도록 하였다. SAS E-Miner를 이용하여 모의실험
데이터를 생성하여, 제안 모형의 성능 평가를 위한 실험을 수행하였다. Cache hit ratio를 이용한 객관적인 성능 평가를 통
하여 제안된 모형의 성능을 확인하였다.

 

[개인저자] 전성해 서강대학교
[공저자] 박정은 서강대학교, 오경환 서강대학교
[원문제목] Support Vector Regression을 이용한 희소 데이터의 전처리
[원문수록처] 한국퍼지및지능시스템학회 논문지    2004년    14권   6호    789 - 792
[발행연도] 2004
[저널명] 한국퍼지및지능시스템학회 논문지    2004년    14권
  웹 마이닝, 바이오정보학, 통계적 자료 분석 등 여러 분야에서 매우 다양한 형태의 결측치가 발생하여 학습 데이터를 희소
하게 만든다. 결측치는 주로 전처리 과정에서 가장 기본적인 평균과 최빈수뿐만 아니라 조건부 평균, 나무 모형, 그리고 마
코프체인 몬테칼로 기법과 같은 결측치 대체 기법들을 적용하여 추정된 값에 의해 대체된다. 그런데 주어진 데이터의 결측
치 비율이 크게 되면 기존의 결측치 대체 방법들의 예측의 정확도는 낮아지는 특성을 보인다. 또한 데이터의 결측치 비율
이 증가할수록 사용가능한 결측치 대체 방법들의 수는 제한된다. 이러한 문제점을 해결하기 위하여 본 논문에서는 통계적
학습 이론 중에서 Vapnik의 Support Vector Regression을 데이터 전처리 과정에 알맞게 변형하여 적용하였다. 제안 방법
을 이용하여 결측치 비율이 큰 희소 데이터의 전처리도 가능할 수 있도록 하였다. UCI machine learning repository로부터
얻어진 데이터를 이용하여 제안 방법의 성능을 확인하였다.

 

[개인저자] 한진우 서강대학교
[공저자] 전성해서강대학교, 오경환 서강대학교
[원문제목] 개선된 밀도 기반의 퍼지 C-Means 알고리즘을 이용한 클러스터 합병
[원문수록처] 한국퍼지및지능시스템학회 논문지    2004년    14권   5호    517 - 524
[발행연도] 2004
[저널명] 한국퍼지및지능시스템학회 논문지    2004년    14권
  1960년대 퍼지 이론이 소개된 이후 데이터 마이닝을 포함한 기계 학습 분야의 군집화 작업에서 퍼지 이론이 폭넓게 사용
되었다. 퍼지 C-평균 알고리즘은 가장 많이 사용되는 퍼지 군집화 알고리즘이다. 이 알고리즘은 하나의 데이터 개체가 서
로 다른 소속 정도를 가지고 각 군집에 할당될 수 있도록 한다. 퍼지 C-평균 알고리즘도 K-평균 알고리즘과 같은 일반적
인 군집화 알고리즘과 마찬가지로 초기 군집수와 군집 중심의 위치에 의해 최종 군집 결과의 성능 차이가 나타난다. 군집
화를 위한 이러한 초기 설정은 주관적이며 이 때문에 적절치 못한 결과를 얻게 될 수도 있다. 본 논문에서는 이 문제를 해
결할 수 있는 방법으로 주어진 학습 데이터의 속성을 기반으로 한 초기 군집수와 군집 중심을 결정하는 개선된 밀도 기반
의 퍼지 C-평균 알고리즘을 제안하였다. 제안 방법은 격자를 사용하여 초기 군집 중심의 위치와 군집수를 결정하였다. 기
존에 많이 이용되었던 객관적인 기계 학습 데이터를 이용하여 제안 알고리즘의 성능비교를 수행하였다.

 

HCI 학회

2002년        세그멘테이션과 이동 경로 가중치에 의한 사용자 다음 요청 예측 에이전트  

임정숙,홍언주,오경환 (서강대학교 컴퓨터학과)