[참석 후기 - 채동규 외 5명] NAVER AI Colloquium

게시자: 배홍균, 2018. 4. 3. 오후 6:22   [ 2018. 4. 3. 오후 8:26에 업데이트됨 ]

2018 NAVER AI Colloquium는 올해 3회째를 맞은 행사로, 검색, 추천, 자연어 처리, 비전, 모빌리티,로보틱스 등 12개 세션의 32개 아젠다 / 23개 포스터&데모 세션으로 구성되었습니다. 작년과 다르게 올해에는 네이버 연구진들 뿐만 아니라 네이버와 산학 연구를 수행하는 AI 분야 교수 및 대학원생들의 발표 또한 진행되었습니다. 김상욱 교수님께서도 recommendation 세션에서 ‘Uninteresting items - A Novel Concept Boosting the Accuracy in Recommendation Systems’ 라는 주제로 발표를 하셨습니다.

본 행사에는 우리 연구실의 채동규, 이연창, 배홍균, 홍석진, 서나윤, 서동혁 학생이 참석하였습니다.


 


[채동규]

네이버 AI 콜로퀴움을 통해서 딥러닝과 관련된 국내의 최신 연구동향을 접할 수 있어서 큰 도움이 되었습니다. 특히 카이스트에서 진행중인 large scale deep learning과 관련된 여러 연구 이슈와 이를 해결하는 과정에서 많은 것을 배웠습니다. UNIST의 해석 가능한 인공지능 연구도 인상깊어 보였습니다. 네이버에서 추천과 검색 기술을 실제 서비스로 제공하기 위해서는 학계에서 고민하지 않는 다른 많은 요소를 함께 고려해서 기술을 개발하는 부분도 새롭게 배울 수 있었습니다.


좋은 세미나에 참석할 기회를 주신 교수님께 감사드립니다. 세미나를 통해 얻은 여러 지식들을 제 연구 진행에 잘 적용해서 좋은 성과로 만들어보도록 하겠습니다.



[이연창]

네이버 ai 콜로키움은 작년에 이어 두 번째로 참석하는 행사입니다. 현재 저희 연구실과 네이버가 추천 관련 산학 과제를 수행 중이어서, 올해 행사에서는 교수님의 구두 발표와 더불어 포스터 세션에서 포스터 발표를 할 기회가 주어졌습니다. 각 세션이 끝나는 쉬는 시간들과 점심 시간마다 포스터 세션이 진행되어, 많은 행사 참석자들과 교류할 수 있는 시간이었습니다. 저희 포스터에 들려주신 많은 분들이 저희 연구를 재밌게 생각하시고 관심을 가져 주셔서 뿌듯한 마음도 들었습니다.


포스터 세션이 진행되지 않는 시간들에는 관심 분야 세션장에서 다양한 AI 기술들의 발표를 들을 수 있었습니다. 여러 발표 중 네이버 최재걸 리더님께서 발표한 generative adversarial nets (GAN) 기반의 click models (제목: GANCM: Generative Adversarial Network Click Model)을 특히 흥미롭게 들었습니다. 해당 발표에서는 네이버 검색 엔진을 사용하는 가상의 users를 GAN을 이용하여 생성한 뒤, 해당 가상 users에게 어떠한 형태 (순서/디자인 등) 로 검색 결과를 제공할 때 가장 많은 clicks을 얻어낼 수 있을지를 분석한 결과를 보여주었습니다.


이번 행사를 통해 다양한 도메인에서 최신 ai 기술을 성공적으로 적용한 사례들을 종합적으로 파악할 수 있어 매우 의미있는 시간이었습니다. 끝으로 의미있는 행사에 참석할 수 있고, 또한 포스터 발표를 통해 다양한 연구자들과 교류할 수 있는 기회를 주신 김상욱 교수님께 감사드립니다.



 


[배홍균]

검색, 뉴스, 쇼핑 등 편리하고 익숙하게 사용 중이었던 네이버의 서비스에 생각보다도 다양한 AI 기술이 이미 적용되어 있었단 사실이 신선한 충격으로 다가왔던 시간이었습니다. 수많은 서로 다른 사용자들의 검색 의도, 클릭 패턴 등의 파악을 위하여 익숙한 이름의 AI 기법인 GAN, RNN 등이 사용되어지고 있다는 점은 무척 흥미로웠습니다. 아쉽게도 아직은 제가 AI 관련 배경 지식을 충분히 갖고 있진 못한 탓에, 세부적인 접목 방법 등을 바로 이해하는데에 있어선 조금 어려움이 따랐지만 네이버가 어떤 목적과 방향으로 AI 기술을 발전시켜 나가고자 하는지에 대해선 무리 없이 받아들일 수 있었습니다.


또한 'AI를 이용한 추천' 섹션엔 다양한 강연들이 준비되어 있었는데, 추천 관련 연구를 하고 있는 입장에서 여러 아이디어들을 떠올려 볼 수 있었던 귀중한 시간들이었습니다. 네이버에서 제공하는 많은 종류의 서비스가 본질적으로 추천과 직, 간접적인 연관을 맺고 있다는 사실을 새삼 느끼며 무심코 지나쳤던 서비스 하나 하나에 대하여 더 관심 있게 살펴봐야겠다는 생각도 갖게 되었습니다.


생생한 기술의 현장을 체험할 수 있도록 기회 만들어주신 김상욱 교수님께 깊은 감사를 드립니다. 점점 더 자연스럽게 생활의 일부가 되어 갈 네이버의 서비스 또한 벌써부터 많이 기다려집니다.



[홍석진]

NAVER가 실제로 AI를 서비스에 어떤 방식으로 적용하는지 알 수 있는 좋은 시간이었습니다. 또한 네이버와 같이 산학협력하고 있는 연구실에서 어떤 연구를 진행하는지도 알 수 있었습니다.


그 가운데 트렌드를 반영하는 Dynamic Word Embedding model이 기억에 남았습니다. 연구하면서 워드 임베딩 모델을 사용할 기회가 있었는데, 이때 생각난 궁금증이 ‘시간이 지나면서 바뀌는 단어 간 의미적 유사도를 어떻게 동적으로 워드 임베딩 모델에 반영할 수 있을까?’ 였습니다. NAVER에서는 잘 학습된 워드 임베딩 모델에 최신뉴스 기사를 이용하여 뉴스기사에 함께 자주 나오는 토픽들을 서로 가깝게 워드 임베딩 공간상에 위치시킴으로써 워드 임베딩 모델이 현재 트렌드를 반영할 수 있도록 연구를 진행했습니다. 즉 ‘맥도날드’와 ‘햄버거병’이 최신 뉴스 기사에서 자주 함께 등장하면 두 단어가 임베딩 공간상에서 가깝게 위치하게 되는 방식입니다. 이 연구 이외에도 많은 NAVER의 연구에서 워드 임베딩 모델이 사용되는 것을 볼 수 있었습니다.


우리가 연구 및 개발하는 기술들이 실제 산업현장에서 어떻게 사용되는지 알 수 있는 좋은 기회였습니다. 참석할 수 있도록 배려해주신 김상욱 교수님께 감사드리고, 다음에도 비슷한 행사가 있으면 참석해보고 싶습니다.



 



[서나윤]

 최근 인공지능 분야에서 다양한 성과를 내고 있는 네이버에서 어떤 연구를 하고 있는지 한 곳에서 소개받을 수 있는 의미 있는 자리였습니다. 참석함으로서 현업에서 서비스중인 기술과 더불어 네이버와 연구 중인 산학 연구실들의 인사이트를 다양하게 듣고 고민해볼 수 있었습니다.


 인상 깊었던 아이디어는 Large scale deep learning 발표에서 소개된 "모델에서 실제로 사용되는 부분을 구분하여 모델 성능을 높이는 것"이었습니다. 이미지 데이터를 분류할 때 모델 내에서 이미지의 특징과 관계가 먼 부분은 비활성화해 관계있는 부분의 학습에 보다 집중하게 하거나, 관계있는 부분만을 그룹화해 해당 부분을 사용하게 하는 등의 방법을 알 수 있었습니다. 같이 소개된 데이터 간 공통된 특징은 공유하되 개별 클래스의 고유한 특징을 추가로 학습에 이용하는 메트릭 또한 흥미로웠습니다.


 추천 세션에서는 주로 현업에서 해결 중인 문제들과 그 접근법이 인상 깊었습니다. 장소 추천 서비스에서는 TPO에 따라 가변적인 사용자의 입맛과 색이 강한 장소의 특징을 함께 아우를 수 있는 방법을 연구 중이었으며, 쇼핑 추천 서비스에서는 소비자의 의도를 정확히 파악하고 다양한 상품을 제공할 수 있도록 노력하고 있었습니다. 특히 쇼핑 추천에서 사용자가 선택한 아이템과 어울리는 코디 상품을 추천하는 데에 GAN을 통해 만든 '어울리는 제품'의 이미지를 활용하는 법을 연구 중인 부분에 관심이 갔습니다. 그밖에 아이템이 가진 내용과 아이템에 대한 사용자 반응을 두 개의 다른 모델을 이용해 하나의 임베딩으로 녹여낸 포스텍의 연구를 관심 있게 들었습니다.


 참석을 통해 경험한 내용을 여러 연구에 적용해보고 싶어지도록 하는 좋은 행사였습니다. 앞으로도 현업과 연구의 최신 동향을 알 수 있는 이러한 세미나에 참석할 기회가 많았으면 하는 바람입니다. 훌륭한 행사에 참석할 수 있게 해주신 김상욱 교수님께 감사드립니다.



[서동혁]

Naver라는 회사가 AI라는 분야에 있어 어떤 세부분야에 관심을 가지고 있으며, 어떠한 노력을 기울이고 있는지를 볼 수 있었고 Naver 뿐만 아니라 여러 산학 관계에 있는 교수님들의 강연을 통해 다양한 분야에 대한 인사이트를 가지게 된 새롭고 즐거운 시간이었습니다.


정말 재미있고 깊이있는 여러 세션들이 있었는데, 그중 제게 있어 가장 흥미로웠던 주제는 <설명 가능한 인공지능 모델 및 응용> 파트 였습니다.

설명 가능한 인공지능 모델이란 여러 머신러닝 모델들, 특히 딥러닝이라는 분야에 있어서 모델의 결과를 설명하려 노력하는 분야를 말합니다. 저도 현재 딥러닝을 집중적으로 공부하고 있는 만큼 관심이 생긴 분야인데, 기본적으로 딥러닝은 모델의 결과가, 즉 문제에 대한 모델의 판단에 대해 어떻게 그러한 판단이 나올 수 있었는지는 블랙박스로 두게 됩니다.

문제는 이것이 mission critical한 분야에 적용되었을 때입니다. 예를들어 VCG net같은 경우 사진을 보고 대략 90%의 정확도로 사진의 인물이 동성애자라는 판단을 해냅니다. 그러나 해당 결과를 바탕으로 어떤 판단을 내릴것인가는 차별 등의 이슈로 상당히 민감한 주제일 수 있기 때문에, 소비자는 이 머신러닝의 결과로 나온 판단에 대해 왜 그런 판단이 나왔는지에 대해 질문할 권리를 가지며, 기업이 이 질문에 대해 적절한 답변을 내지 못하는 경우에는 기업의 ‘전 세계 매출의 4%’를 벌금으로 매긴다고 합니다.

 이러한 문제를 극복하기 위해 최근에는 딥러닝의 히든레이어들에 많은 출력단자를 두어 모델이 판단을 내리기까지 어떤 변화가 있는지 설명해내려고 노력하고, 이미지 분석모델의 경우 LRP알고리즘이라는 방법을 통해 이미지의 어떤 부분을 통해 해당 결정을 내렸는지를 설명하려는 논문도 쏟아지고 있습니다. 자율주행 차량같은 경우에도 정확도가 조금 낮을지언정 어떤 부분을 통해 주행결정을 내렸는지를 알 수 잇는 차량의 선호도가 더 높다고 합니다. 주가 예측같은 경우에도 기존의 그래프의 어느부분이 가장 큰 영향을 미쳐서 이러한 예측결과가 나왔다라고 설명하는 모델이 큰 관심을 얻는 중입니다.


이외에도 네이버가 자랑하는 Clova 와 NSML등의 기기 및 시스템에 대한 강연 등 실제 세계와 데이터 사이언스가 어떻게 연결되는지 느껴볼 수 있었던 좋은 시간이었습니다. 저를 넓힐 수 있었던 기회를 주신 김상욱 교수님께 감사드리며 앞으로도 이런 기회가 많았으면 하는 바람입니다.


[참석 후기 - 이연창] AAAI 2018

게시자: 배홍균, 2018. 2. 11. 오후 9:44   [ 2018. 2. 11. 오후 9:52에 업데이트됨 ]

AAAI Conference on Artificial Intelligence (이하 AAAI)는 올해로 32번째로 열리는 역사가 깊은 학술대회로, 인공 지능 분야에 다양한 학문을 다루고 있습니다. 올해는 미국 뉴올리언스에서 2 2일부터 7일까지 6일 동안 진행되었습니다. 이번 AAAI에서는 거의 1000편에 가까운 논문들이 발표되었고, 2000명이 넘는 사람이 참석했다고 합니다.

 

 

저는 한 편의 논문 구두 발표를 하기 위해 참석하였습니다. 논문의 제목은 “gOCCF: Graph-Theoretic One-Class Collaborative Filtering Based on Uninteresting Items”으로단일 클래스 협업 필터링 상황에서 사용자가 관심 없을 것으로 예상되는 상품들을 찾아, 이를 활용하여 보다 정확한 추천을 제공해주기 위해 다양한 graph theory graph analysis 방법들을 활용하는 approach를 제안하였습니다.

 

처음으로 우리 분야 탑 컨퍼런스에 참석하는 것이었는데, 출국 전까지 다른 학회 논문 제출 데드라인이 겹치는 바람에 발표 준비를 마무리하지 못 하고 가서 많이 긴장되었습니다. 뉴올리언스 가는 비행기부터 발표 직전까지는 계속 발표 준비를 하느라 정신이 없었습니다. 다행히 김상욱 교수님께서 발표 직전까지 계속 피드백을 주셔서 무사히 발표를 마칠 수 있었습니다.

 

제 논문 외에도 다양한 논문들이 발표되었는데, 특히 “GraphGAN: Graph Representation Learning with Generative Adversarial Nets” 이라는 논문 발표를 흥미롭게 들었습니다. 해당 논문은 GAN을 활용하여 graph에서의 missing links 중 생성될 만한 links generate하는 방법을 소개하였습니다. Graph representation learning 에서는 처음으로 GAN을 사용한 논문입니다. 특히, graph의 다양한 특성을 고려하여 generate할 수 있는 Graph softmax를 제안하였습니다.

 

이번 학회 참석으로 많은 것을 보고 배울 수 있었지만 특히 2가지 인상 깊은 부분이 있었습니다. 하나는 머신 러닝에 대한 관심입니다. 다양한 세션이 여러 장소에서 동시에 진행되었는데, 특히 머신 러닝 세션 장소는 완전히 꽉 차 문 밖에서까지 서서 듣는 사람들이 많았습니다. 다른 하나는 중국인의 파워였는데, 학회를 후원하는 회사의 거의 반 정도가 중국계 회사였고, 참석자들도 체감상 대부분이 중국인 같아 보였습니다. 이러다 보니, 포스터 발표 장에서 질의 응답하는 사람들 중 반은 영어로 하고, 반은 중국어로 대화하는 분위기였습니다. 영어 때문에 여러 가지 어려움을 겪는 저와는 달리, 중국사람 입장에서 학회 참석의 생산성을 매우 높이는 요소가 되는 것 같아 많이 부러웠습니다.

 

 

관심 있는 세션들의 발표를 듣는 시간 외에는 뉴올리언스를 여행하였습니다. 관광할 만한 곳이 한 군데에 몰려 있어 쉽게 관광할 수 있었습니다. 뉴올리언스는 재즈의 본고장이라고도 불리는데, 이에 걸맞게 도시를 걷다 보면 재즈 공연을 하는 사람들을 쉽게 찾아 볼 수 있었습니다. 오랜만에 아주 여유롭게 휴식을 취할 수 있는 시간이었습니다.

 

끝으로 논문 작성부터 발표 준비까지 꼼꼼히 지도해주신 김상욱 교수님께 감사드립니다. 또한, 연구에 있어 의미있는 피드백을 많이 주신 이동원 교수님께도 감사드립니다



[참석 후기 - 강윤석] CIKM 2017

게시자: 배홍균, 2017. 11. 13. 오후 9:50

ACM International Conference on Information and Knowledge Management (이하 CIKM) ACM Special Interest Group on Applied Information Retrieval (SIGIR)이 후원하는 학술대회로, 올해로 26번째로 열리는 Data를 다루는 분야에 다양한 학문을 다루는 학술대회입니다. 올해는 2017 11 6()부터 10()까지 싱가포르에서 진행되었습니다.

저는 한편의 포스터 논문을 발표하였습니다논문의 제목은 “A Framework for Estimating Execution Times of IO Traces on SSDs”으로 다양한 SSD에서의 응용프로그램의 성능을 직접 수행하지 않고 예측하는 방법을 제안하는 내용을 담고 있습니다좋은 학회에서 발표 하는 것이 이번이 처음인지라 살짝 긴장되긴 하였으나시간이 좀 지나고 나니 자연스럽게 저의 논문에 관심을 가지고 있던 사람들과 다양한 내용을 논의 할 수 있었습니다.

   

이번 CIKM에서 다양한 주제의 키노트와 논문들이 발표되었습니다. 저는 그중 머신러닝, 소셜미디어, 그래프 분석에 집중했습니다. 키노트 발표 중 하나였던 아마존에서 어떻게 뉴럴넷을 사용하는 지를 설명(Machine Learning @ Amazon)하는 발표가 매우 흥미로웠습니다. 아마존에서는 추천 뿐만 아니라 드론, 아이템 분류, QnA, 시멘틱 매칭과 같은 다양한 분야에서 머신러닝이 사용되는데, 이들이 어떻게 사용되는지 설명하는 것이 매우 흥미로웠습니다. 추천시스템의 이슈 중인 하나인 multiple personas (한 계정을 여러 명이 사용할 때 어떻게 추천하는지에 대한 이슈)에 대해서 머신러닝을 사용하고, 각각의 사용자를 분석해서 각각의 추천을 해주는 것이 흥미로웠습니다.

Social media에서는 “Modeling Affinity based Popularity Dynamics”라는 논문이 흥미로웠는데, CS 분야의 각 논문의 영향력(citation 기준)을 특정 시간에 따라 예측하는 방법을 다루는 논문입니다. 이 논문에서는 (1) CS 논문이라고 해서 CS 분야에서만 citation되는 것이 아니라, 다양한 분야에서도 citation 될 수 있다는 것과 (2) 각 분야에서 citation 되는 시점이 다를 수 있다는 것, 그리고 (3) 각 분야에서 해당 논문의 파급되는 영향력이 다를 수 있다는 것을 가정하고, 이들을 모두 고려하여 앞으로의 citation 수를 예측하는 모델을 제안하고 이를 평가하였습니다. 모델 자체는 수학적인 내용이 많아서 완벽하게 이해하기는 어려웠습니다. 그러나 이 논문이 흥미로웠던 이유는 발표들을 들을 때마다 각 논문에서 제안하는 방법이 좋다고 주장하는 것이 무엇인지, 그리고 그것들을 어떻게 실험에서 보일지 등을 생각하면서 들었었는데 해당 논문이 제가 그나마 생각한 것들을 다른 논문 발표에 비해 그나마 많이 보여줬었기 때문입니다.

싱가폴은 도시 국가로 작은 면적의 나라입니다. 심지어 학회 기간을 제외하고 2일을 관광했는데도 싱가폴을 거의 다 돌아볼 정도였습니다. 이번 학회를 참석해서 매우 큰 자극을 받게 되었고, 휴식을 하면서 여유도 느끼고 재충전의 시간을 가질 수 있었습니다. 끝으로학회 참석에 전폭적으로 지원해주시고 해당 연구를 진행 할 수 있게 큰 도움을 주신 김상욱 교수님, 배완덕 교수님, 차재혁 교수님께 깊이 감사 드립니다. 또한 부족한 저를 잘 이끌어주고 조언해준 용연이에게도 감사의 마음 전합니다.



[참석 후기 - 이연창, 구장완, 장명환] SMC 2017

게시자: 배홍균, 2017. 10. 15. 오후 7:57

IEEE Systems, Man, and Cybernetics Society가 후원하는 IEEE International Conference on Systems, Man, and Cybernetics (이하 SMC)는 인공 지능 분야에 다양한 학문을 다루는 학회입니다. 올해는 캐나다에 있는 밴프에서 10월 5일부터 8일까지 4일 동안 진행되었습니다.


이번 SMC에는 우리 연구실에서 이연창, 구장완 연구원이 구두 발표를, 장명환 연구원이 포스터 발표를 하기 위해 참석하였습니다. 이연창 연구원이 발표한 논문의 제목은 “Exploiting Job Transition Patterns for Effective Job Recommendation”, 구장완 연구원이 발표한 논문의 제목은 “Incremental Maintenance of C-Rank Scores in Dynamic Web Environment”, 장명환 연구원이 발표한 논문의 제목은 “Efficient Processing of Large-Scale Sparse Matrix-Matrix Multiplications on a Single Machine”입니다.


각 논문에 대해 간략히 요약하면, 이연창 연구원의 논문은 링크드인과 같은 구인/구직 사이트에서 각 구직자에게 가장 적합한 구인 공고를 추천해 주는 방안에 대한 내용을 담고 있습니다. 특히, 구직자의 이력 내에 순서를 고려하기 위한 다양한 방법들을 제안하였습니다.

구장완 연구원의 논문은 웹의 상태 변화를 반영하기 위해 문서들의 랭킹을 결정하기 위한 기반이 되는 C-Rank 점수를 주기적으로 갱신하는 방법을 제안하는 논문입니다.

마지막으로, 장명환 연구원의 논문은 단일 머신의 사용할 수 있는 메모리 크기가 제한된 상황에서 희소 행렬끼리의 곱셈을 가장 효율적으로 수행할 수 있는 방법을 분석하고 제안하는 논문입니다.


이 외에도 다양한 인공 지능 분야의 논문들이 발표되었는데, 특히 “Implementation of Human-Robot VQA Interaction System with Dynamic Memory Networks”와 “Effect of Parameter Sharing for Multimodal Deep Autoencoders”를 흥미롭게 들었습니다. 첫 번째 연구는 사용자 주변의 환경을 이해하여 이에 대한 정보를 natural language로 사용자에게 제공하는 Human-Robot Interaction (HRI) 시스템을 제안하였습니다. 특히, 해당 논문에서는 Visual Question Answering (VQA)를 위해, Dynamic Memory Networks (DMN) 와 deep learning network를 통합하는 방법을 보여주었습니다.

두 번째 연구는 단일 종의 센서를 이용하였을 때의 해석 오차를 줄이기 위해 서로 다른 기종의 센서를 활용하여 데이터를 얻고, 이를 뉴럴 네트워크에 학습시켜 정확도를 향상시키는 방법에 관한 것이었습니다. 또한 Autoencoders를 적용하여 Raw 데이터의 핵심 데이터만을 추출하여 학습하도록 하였습니다. 그러나 기존 연구와의 비교가 없어 얼마나 정확도가 향상되는지 알기가 어려웠던 점이 아쉬웠습니다.



[구장완]


제가 처음으로 참석한 해외 학회인 IEEE SMC은 인공 지능 분야의 대표적인 학회 중 하나입니다. 이번 SMC 2017은 Canada의 Banff라는 지역에서 열렸습니다.  아름다운 풍경을 자랑하는 Banff라는 지역에서 발표를 할 수 있는 기회를 얻게 되어 기분이 들뜨기도 하면서, 한편으로는 해외 학회에서 영어로 발표를 해야 된다는 부담감이 생기기도 했습니다. 4일 간의 학회 기간 중 2번째 날, 저는 “Incremental Maintenance of C-Rank Scores in Dynamic Web Environment”라는 주제로 구두 발표를 했습니다. 다행이도, 학회에 참석하기 전 연구실 내부에서 진행한 리허설에서 얻은 교수님과 선후배들의 조언을 통해 발표 준비에 많은 도움을 얻을 수 있었기에, 무사히 발표를 마무리할 수 있었습니다. 뿐만 아니라, 해외 학회에서 발표해보는 실전 경험과 다른 사람들의 발표를 들으며 더욱 많은 점을 배울 수 있었습니다. 이렇게 배운 점을 밑거름 삼아 더욱 발전하는 계기가 되었으면 좋겠습니다.

또한, 현재 진행하고 있는 추천 연구와 관련된 분야의 발표들을 주목해서 들었습니다. 그 중에 가장 인상 깊었던 발표는 “Modeling Prediction in Recommender Systems Using Restricted Boltzmann Machine”이었습니다. 이 연구에서는 딥러닝의 한 종류인 Restricted Boltzmann Machine (RBM)을 Collaborative Filtering에 적용한 기존 연구를 발전시켰습니다. 단순히 rating 정보만을 사용하던 기존 연구에서, 추가적으로 similarity와 popularity 정보를 사용해서 정확도를 높였습니다. 추천 분야에서도 딥러닝이 적용되는 추세에서 관련된 논문의 발표를 들으며 지식의 폭을 넓힐 수 있었습니다.

마지막으로, 이번 학회 참석을 계기로, Banff 이외에도 캐나다의 여러 도시들을 여행했습니다. SMC 학회를 마무리하는 것과 동시에 여행을 통해 몸과 마음을 가다듬고 회복할 수 있는 좋은 기회였습니다.

 


[장명환]

이번 SMC에 제출한 논문의 포스터 발표를 위해 학회에 참석하였습니다. 학회 첫째 날과 둘째 날에는 사람들이 많이 모이지 않아서 여유가 생길 거라고 생각했는데, 포스터 발표를 하게 되는 셋째 날에 사람들이 많이 모였습니다. 그래도 머신 러닝 등의 주제에 대한 포스터들에 사람들이 많이 모여서 설명을 듣느라 다른 곳은 비교적 한산했습니다. 가끔 한두 명이 포스터의 내용을 질문하였는데 구두 발표가 아니어서 그런지 요점만 설명해주는 것으로 끝났습니다.


포스터는 중국 사람들이 전시한 것들이 많았습니다. 저는 그 중 뉴럴 네트워크를 이용하여 센서의 오차를 줄이기 위한 연구 포스터를 보다가 설명을 듣기도 하였습니다. 이 날 저녁에는 SMC에서 주최한 식사를 하면서 다음 번 학회에 대한 내용을 들었습니다. 생각보다 많은 사람들이 모인 상태에서 시상식 등을 진행하였습니다.


학회가 열린 캐나다 밴프는 서울보다 규모가 작은 도시처럼 느껴졌습니다. 그러나 주변 볼거리가 있는 곳까지의 거리가 멀어서 많은 시간을 차로 이동하는 데에 보냈습니다. 밴프 곤돌라와 아이스필드 설상차, 레이크 루이스, 크루즈 등 많은 장소에 다녀오면서 맑은 배경을 감상하였습니다. 또한 주변이 온통 산맥이어서 풍경이 꽤나 시원하였습니다. 비가 온다는 예보가 있었지만 다행히도 저희의 관광 일정 직전이나 직후에 잠깐 비가 내려서 탈 없이 다녀올 수 있었습니다.


 


[이연창]

작년에 이어 두 번째로 SMC에 다녀왔습니다. 올해는 Banff라는 캐나다 로키 산맥 내에 위치한 아주 아름다운 마을에서 학회가 열렸습니다.  작년 SMC에서는 900편이 넘는 논문이 발표되다 보니 많이 어수선한 느낌을 받았는데, 올해는 편수도 500편 정도로 줄고 학회 장소가 여러 건물로 분산되다 보니 많이 차분해진 느낌이었습니다. 밴프라는 장소 또한 차분한 느낌을 주는 데 한 몫한 것 같기도 합니다.


제 발표는 오전 8시에 시작되는 세션에 포함되어 있어, 새벽부터 일어나 학회장에 가야했습니다. 너무 이른 시간에 시작해 발표자들과 몇 명의 사람만 발표 장소에 있었습니다. 학회 참석 전 연구실 선/후배들 앞에서 리허설을 준비한 덕분에, 정해진 시간 내에 발표 및 질의 응답을 마칠 수 있었습니다. 다만, 총 3개의 질문을 받았는데 한 가지 질문에 대해서는 명확히 답변을 해주지 못 한 것이 약간 아쉽습니다.


학회 참석 전/후로는 캐나다 내에 다양한 곳(옐로우나이프, 밴프, 밴쿠버)들을 방문하여 관광을 하였습니다. 특히, 옐로우나이프에서 본 오로라와 밴프에서의 풍경들은 평생 잊지 못 할 것 같습니다. 관광 내내 대부분 날이 좋아 더욱 즐거운 마음으로 여행을 할 수 있었습니다.


끝으로 논문을 완성할 수 있도록 세심하게 도움 주시고 학회에 참석할 기회를 주신 김상욱 교수님께 감사드립니다. 또한, 졸업 후에도 논문에 대해 검토해 준 유진이와, 지원 선배에게도 감사 인사드립니다.



[참석 후기 - 조용연, 강윤석] EDB 2017

게시자: 배홍균, 2017. 8. 9. 오후 10:26

올해 8 7()부터 9()까지 부경대학교에서 개최되는 “The seventh International Conference on Emerging Databases - Technologies, Applications, and Theory (EDB2017)”에서는 database, datamining과 같은 주제로 초청 강연 및 기조연설들이 진행되었습니다또한 최신 연구·개발 성과를 소개하는 35편의 논문 발표는 물론이고, 5개의 초청강연 등이 개최되었습니다본 학회의 참석자는 교수님조용연과 강윤석 연구원이 참석하였고조용연 연구원은 “Efficient Processing of Alternating Least Squares on a Single Machine”을 구두 발표하였습니다.


 


[조용연]

KCC 2017에 이어 얼마 지나지 않아 한번 더 학회에 참석하게 되었습니다본 학회는 KCC와 달리 구두발표자로 참석하게 되었고부산에서 열렸지만 국제학회로써 영어로 발표를 진행했습니다리허설 때부족했던 부분을 보완하여 주어진 발표시간에 맞추어 발표하였습니다특히질의 응답시간에는 예상 질문을 준비했던 것이 많이 도움이 되어 무리없이 답변할 수 있었습니다.

학회 장소인 부경대학교는 국립대인 만큼 꽤 큰 캠퍼스로 구경하려고 시도했지만부산 날씨가 매우 더워 모두 둘러볼 수 없었습니다또한 부경대학교와 바로 인접하게 경성대학교가 있어주변의 거리는 건국대학교와 같이 대학생들이 밤 늦게까지 북적이는 장소였습니다그래서 여가시간에는 주변의 맛집들을 방문하며 즐거운 시간을 보낼 수 있었습니다.

이와 같은 좋은 기회를 제공해주시고 본 연구를 진행함에 있어 전체적으로 지도해주신 해주신 교수님과 실험과 관련하여 많은 도움을 준 장면환에게 감사한 마음을 전합니다.


[강윤석]

최신 연구 동향 파악을 위해 8 7일부터 9일까지 부산에서 열리는 EDB 2017에 참석했습니다경로 데이터 마이닝그래프 연산 알고리즘, NoSQL 등과 같은 다양한 주제로 많은 논문들이 발표되었고다양한 초청 강연이 열려서 많은 연구 지식을 습득 할 수 있었습니다저는 이번 학회에서 논문을 발표하지는 않았으나용연이를 비롯한 많은 사람들의 발표를 들을 수 있었습니다이번 학회를 통해서 확실히 우리 연구실이 발표 준비를 열심히 한다는 것을 느꼈고 (학회장 가는 기차에서 발표자료를 만드는 사람을 봄...), 발표도 잘하는 것을 느꼈습니다뱅킷에서도 다양한 프로그램을 진행했는데 어떤 그룹을 불러서 노래를 부른 것과 경품 추첨이 인상적이었습니다 (비록 경품(갤럭시 탭, LG )은 타지는 못했지만....).

부산은 우리나라의 제 2의 도시라고 해서 매우 크지만 날씨가 너무 더워 저녁에만 둘러 볼 수 있었습니다부산의 야경을 보러 광안대교 쪽으로 갔는데 너무 아름다웠습니다학회 참석차 다른 장소를 간다는 것이 재충전이 되고연구를 더 열심히 해야겠다는 동기부여가 된다는 것을 다시 한 번 느낄 수 있었습니다이날이 CIKM논문 발표가 난 상황이라서 그런지 더 크게 느껴진 것 같기도 합니다.

이와 같은 좋은 기회를 제공해주신 교수님께 감사한 마음을 전합니다. 


  


[참석 후기 - 홍지원 외 7명] KCC 2017

게시자: 배홍균, 2017. 6. 27. 오전 4:41   [ 2017. 10. 15. 오후 7:58에 업데이트됨 ]

올해 6월 18일(일)부터 20일(화)까지 라마다 프라자 제주호텔에서 개최되는 “Korea Computer Congress 2017”에서는 “4차 산업혁명의 원동력! 소프트웨어”라는 주제로 관련 산업의 발전 추세를 점검하고, 학문 분야의 발전을 도모할 수 있도록 관련 분야 여러 박사님의 기조연설, 다양한 분야의 초청강연, 11개의 튜토리얼 등 국내외 저명인사들의 유익하고 알찬 강연들이 있었습니다.

또한 최신 연구·개발 성과를 소개하는 700여 편의 논문 발표는 물론이고, 분과 워크샵으로 소프트웨어공학 역사, 사물인터넷 실무 개발자를 위한 기술 공유, 정보통신 기술, 4차 산업혁명과 데이터베이스등이 개최되었습니다. 아울러 오픈데이터 포럼, 한국DB개발역사 등의 협력 워크샵과 여성신진연구원 특별세션, 신진교수 특별세션 등 다양한 프로그램을 선보였습니다. 특히, 단순한 학술논문의 발표에 그치지 않고 데모구현 경진대회와 우수학술대회 발표논문 세션을 비롯한 다양한 프로그램으로 활기찬 학술대회였습니다.

연구실에서는 교수님을 포함한 재학중인 모든 박사과정 (채동규 제외 [군사훈련])과 구장완과 홍동균 석사과정이 참석했습니다. 또한 하지운 박사님은 해외우수학회 초청 논문 발표 그리고 이영남 졸업생은 최우수 논문상 수상을 위해 학회에 참석하였습니다. 참여한 재학생들은 포스터 세션에 참석하여 우수 발표 논문상을 목표로 열심히 발표하였습니다 (홍지원-, 조용연-실세계 그래프의 특징을 반영한 그래프 엔진, 강윤석-SSD에서의 IO 트레이스 수행시간 예측 방안, 고윤용-커뮤니티 기반 영향력 최대화를 위한 효율적인 CELF 알고리즘, 이연창-단일-클래스 협업 필터링 환경에서 무관심 상품의 수 결정 방안, 송준호-정규화를 지원하는 효율적인 시계열 서브시퀀스 매칭, 구장완-동적 웹 환경에서의 C-Rank 성능 평가, 홍동균-추천시스템에서의 컨텐츠 기법 필터링 기법의 효과. )

학회 기간 중 교수님의 지원 덕분에 참석자들이 함께 만찬을 즐기며, 일상 등의 대화를 나누며 즐거운 시간을 보냈습니다. 학회 이외의 기간은 각자 개인 또는 단체의 시간을 보내면서 즐거운 시간을 보냈습니다.


 
 

[조용연]

매우 오랜만에 국내 학회에 참석하게 되었습니다. 해외 학회와 달리 영어 발표가 아니기에 포스터를 작성하고 스크립트를 만드는 부담은 상대적으로 적었습니다. 그러나 본 참석의 목표 중 하나는 우수 발표 논문상이기에 최대한 꼼꼼히 준비하려고 노력하였습니다. 발표 후, 긴장해서 말을 빠르게 한 점이 아쉬움으로 남았지만, 최선을 다했기에 한편으로는 상을 기대하고 있습니다 (웃음).

학회 참석 중 매우 인상 깊었던 점은 포스터 “동형 서브그래프 검사 시 하이퍼에지 정보를 고려한 하이퍼 그래프 쿼리 시스템 설계”였습니다. 석사과정임에도 불구하고 심도 있는 연구 결과를 포스터로 발표하였고, 발표 연습을 매우 많이 한 것 같은 모습이 감탄하였습니다.

끝으로 본 연구를 진행함에 있어 전체적으로 지도해주신 해주신 교수님과 실험과 관련하여 많은 도움을 준 장면환에게 감사한 마음을 전합니다. 또한 교수님과 연구실 지원 덕분에 박사과정을 비롯한 많은 연구원들이 참석하여 평상시 쉽게 모이기 어려웠던 자리들을 마련하여 맛있는 음식과 담소를 나누며 즐거운 시간들을 보냈습니다.



[홍동균]

대학원 입학 후 첫 학회를 고향인 제주도에서 하게되어 기쁜 마음으로 다녀오게 되었습니다. 포스터 세션 중에는 제 포스터를 관심있게 봐주신 분들이 꽤 많아서 즐겁게 그리고 열심히 설명을 했던 것 같습니다. 아마 제가 발표한 포스터가 추천이라는 흥미로운 주제이기도 하였고, 포스터에 영화 포스터가 있던게 관심을 끌었던 것 같습니다.

학회 중 카이스트 문화 기술 대학원 박사과정 분의 포스터를 흥미롭게 봤었습니다. 포스터 제목은 "온라인 클릭베이트 스팸 탐지 모델"이라는 포스터 발표를 인상 깊게 들었습니다. 이 포스터는 SNS상에서 해시태그를 통해 발생할 수 있는 정보 검색 오류문제를 방지하고 효과적인 검색 결과를 제시하는 방안에 관련 된 연구인데, 실제 SNS상의 데이터를 가지고 실험한 것이 매우 흥미로웠습니다.

본 연구는 제가 석사 과정 대부분의 시간을 진행한 연구에서 나온 결과로, 지도해주신 김상욱 교수님과 연창 선배 그리고 이종욱 교수님께 감사의 마음을 전합니다. 그리고  교수님과 연구실의 지원 덕분에 학회에 가서 즐거운 시간을 보낼 수 있었습니다.



[고윤용]

처음으로 KCC 학회에 참석하게되었습니다. 특히, 제 고향이기도한 제주에서 학회가 개최되어 더욱 즐거운 마음으로 학회에 다녀올 수 있었습니다. 해외 학회에서 포스터 발표를 한 경험이  있었고 한글 발표였기 때문에 비교적 편하게 준비를 할 수 있었으나, 심사위원 앞에서 발표를 할 때는 긴장이 되기도 했습니다. 포스터 세션의 다들 포스터들중 충북대에서 진행한 ‘해시태그 기반의 유해 포스팅 검출 기법’에 대한 연구를 흥미있게 들었습니다. 해당 연구는 과거 포스팅들 중 유해한 포스팅들을 분리하여 해당 포스팅들이 포함하고 있는 해시태그들을 ‘유해 해시태그’로 정의합니다. 그 후 새로운 포스팅에 대해 유해 해시태그로 지정된 해시태그를 포함하는 포스팅들을 유해한 포스팅으로 분류했습니다. 실험적으로 좋은 결과를 보이긴했으나, 만약 유해한 포스팅에 아무 죄없는 일반적인 해시태그가 존재한다면, 자칫 유해하지않은 포스팅이 유해 포스팅으로 분류될 수도 있겠다는 생각도 했습니다.

포스터 발표 이외에 정보과학회 논문 경진대회에 운좋게 입상하여 장려상을 수상하는 영광도 얻었습니다. 저희 연구실에서는 지난 학기 졸업생인 이영남 연구원이 최우수상을 수상하여 함께 시상식에 참여했습니다. 국내의 많은 우수 대학의 지원자들 사이에서 저희 연구실이 최우수상과 장려상을 수상하게 되어 자랑스러움을 느꼈고, 다시 한번 항상 잘 지도해주시는 교수님과 함께 연구를 진행해온 후배인 조경재 군에게 감사의 마음을 전합니다.



[이연창]

KCC는 국내에서 컴퓨터공학에 관련된 연구를 하는 학부생, 대학원생, 교수, 회사원들이 모두 모이는 자리로, 이번 학회 참석을 통해 다양한 분야의 연구 결과를 확인할 수 있는 시간을 가졌습니다. 학회는 제주도의 라마다 호텔에서 개최가 되었고, 제 논문 발표가 포함된 포스터 세션은 호텔 내에 바다가 보이는 경치 좋은 장소에서 진행되었습니다. 3시간 동안 진행된 세션 동안 심사위원님과 여러 연구원들이 제 포스터에 관심을 가지며 다양한 피드백을 주었습니다. 특히, 심사위원님께서는 실험 결과를 보고 기존 최신 기술들에 비해 상당한 개선을 보이는 것에 놀라시며, 좋은 연구가 될 것 같다며 덕담 또한 해주셔서 뿌듯한 기분을 느꼈습니다.

이번 KCC에서는 각 분야 최우수 학술대회에 발표된 국내 대학원생들의 초청 발표 또한 진행되었는데, 우리 연구실의 CIKM 논문 외에 제 연구 분야와 관련된 다양한 논문들이 발표되어 관심있게 들었습니다. 그 중, 포항공대 유환조 교수님 연구실에서 올해 WWW에서 발표한 ‘Do "Also-Viewed" Products Help User Rating Prediction?’를 흥미있게 들었습니다. 해당 논문은 온라인 쇼핑몰에서 특정 타겟 상품을 본 사용자들이 본 다른 상품들인 “also-viewed” products라는 개념을 활용하여 사용자의 상품 평점을 예측하는 데 있어 상당한 정확도 개선을 보였습니다.

그 외에 다양한 논문 발표를 보며, 각 분야의 연구 트렌드를 확인해볼 수 있었습니다. 논문 발표 시간들 외에는 제주도 곳곳에 방문하여 맛있는 제주 음식들도 먹으며 오랜만에 여유로운 휴가를 즐길 수 있었습니다. 이러한 좋은 기회를 가질 수 있도록 많은 도움을 주신 김상욱 교수님께 감사드립니다.



[강윤석]

저 역시 처음으로 국내 학회에 참석했습니다. 영어로 준비하지 않아도 된다는 부담은 없었으나, 수상을 위해 심사위원 앞에서 발표를 잘해야 한다는 부담을 갖고 많은 준비를 하였습니다. 많은 발표 연습을 한 덕분에 (제 생각에는) 심사위원 앞에서 차분하게 발표를 했다고 생각하고, 상 받는 것을 아주 미약하게나마 기대하고 있습니다.

이번 학회는 논문 발표만이 아닌 다양한 워크샵들도 있어서 다양한 정보를 접할 수 있었습니다. 그중 인상 깊었던 것은 삼성전자 주관한 협력 워크샵인 “IoT시대를 준비하는 Tizen 플랫폼 개발 설명회” 였습니다. Tizen 플랫폼을 이용하여 IoT에 쉽게 적용할 수 있도록 어떻게 개발했는지, 해당 플랫폼을 어떻게 사용하는지에 대한 설명회 였습니다. 저는 Tizen이 소수의 전자 제품(스마트와치, 스마트폰)에만 탑재되었기에 발전의 여지가 별로 없을 것이라 생각했었습니다. 그러나 위의 전자 제품 뿐만 아니라 실생활의 대부분의 전자 제품(TV, 청소기, 냉장고 등)에도 탑재할 수 있을 만큼 발전됐다는 사실이 매우 놀라웠습니다.

끝으로 저의 연구를 진행함에 있어 전체적으로 지도해주신 해주신 교수님, 해당 연구 방향에 대해서 조언을 해준 차재혁 교수님, 그리고 논문 작성에 대해서 조언을 해준 배완덕 교수님께 감사한 마음을 전합니다. 또한, 해당 연구를 진행하면서 부족한 저를 이끌어주고 많은 조언을 해준 용연이에게도 감사한 마음을 전합니다.



[홍지원]

제주도에서 열린 KCC 2017에서 곧 졸업 예정인 방재근 연구원과 졸업생 이유진 연구원의 연구가 발표되었습니다. 사정이 있어 학회에 참가하지 못한 두 사람을 대신하여 같이 연구를 진행한 제가 발표를 담당하게 되었습니다. 덕분에 여러 세션에 참가하며 다양한 주제에 대한 연구 동향을 살펴볼 수 있어 즐거운 시간이 되었습니다. 특히 포항공대에서 발표한 ‘얼굴 스푸핑 공격 검출을 위한 멀티 색 채널 질감 특징 추출 및 인코딩 방법’이 인상적인 발표였습니다. 최근의 다양한 바이오 인증 방법에 대한 공격 및 방어 방법들에 대한 흥미로운 의견을 들을 수 있었습니다.

제주도는 국내지만 자주 가기 어려운 곳이라 오후 세션이 끝난 후에는 가족들과 함께 여행하는 기분으로 관광지를 방문하거나 맛집을 찾아다니며 재충전하는 시간을 가질 수 있었습니다. 이러한 기회를 양보해준 재근이와 유진이에게, 그리고 연구를 지도해주신 교수님께 감사의 마음을 전합니다.



[송준호]

이번 제주도에서 열린 KCC 2017은 데이터베이스 등 컴퓨터 관련 여러 분야에서 의미 깊은 연구 성과를 학생부터 교수 및 회사원 등 다양한 사람들이 모여 교류할 수 있는 좋은 시간이었습니다. 저는 “정규화를 지원하는 효율적인 시계열 서브시퀀스 매칭” 방안에 대해 포스터 발표를 진행하였습니다. 처음으로 연구 성과를 학회에서 여러 사람에게 발표하는 자리였기 때문에 많이 긴장되고 떨렸지만, 학회 전, 연구실에서 진행한 리허설덕분에 차분히 발표를 마칠 수 있었습니다.

이번 학회에서는 다양한 분야의 연구가 발표되었는데, 그 중에서도 한 사람의 애견인으로서,  “강아지 활동 분석 시스템의 센서 신호의 주파수 성분 분석”이라는 연구가 흥미로웠습니다. 강아지의 활동 분석을 위한 시스템의 성능을 효율적으로 향상 시키는 방안을 제안하는 연구로, 강아지 활동 분석 시스템 센서 신호의 주파수성분을 분석하여 효율적인 특징값 추출하는 방법을 소개하였습니다.

학회를 마친 후, 연창이와 장완이랑 함께 제주도 곳곳을 돌아다니며, 여러가지 레져를 즐기고 맛있는 음식을 먹으면서 여유로운 시간을 가졌습니다. 날씨가 궂어 아쉬웠지만, 그래도 충분히 재충전의 시간을 가질 수 있었던 것 같습니다.

마지막으로, 저의 연구에 많은 도움을 주신 교수님과 논문 작성에 있어 끝까지 조언을 주신 임성채 교수님과 연구실 선후배들에게 감사의 말을 전합니다.



[구장완]

이번 KCC 2017은 제 대학원 생활에서 처음으로 참석한 학회였기에, 더욱 뜻 깊고 의미 있는 시간이었습니다. 데이터베이스, 인공지능 등 다양한 분야의 포스터 발표, 구두 발표를 들으며 견문을 넓힐 수 있는 좋은 기회였습니다. 뿐만 아니라 4차 산업 혁명을 선도할 SW 인재 양성을 목표로 하는 KCC에 참석한 교수, 학생, 연구원들의 열정을 느낄 수 있었습니다. 이에 자극을 받아 더욱 열심히 공부를 해서 성장해야 겠다는 다짐을 했습니다.

저는 “동적 웹 환경에서의 C-Rank 성능 평가”라는 포스터를 발표했습니다. 첫 학회 발표라 그런지 떨렸지만, 준비한 것들을 머릿 속으로 되새기며 차분히 발표할 수 있었습니다. 또한, 이번에 추천 연구를 시작하면서 추천 시스템과 관련된 발표들에 더 많은 관심을 가졌습니다. 그 중 가장 인상 깊었던 발표는 “합성곱 신경망을 활용한 개인 맞춤형 연관 이슈 추천 시스템”이었습니다. 이 연구에서는 딥러닝의 한 종류인 합성곱 신경망을 활용하여 수집된 한글 뉴스기사들을 분석한 후 개인이 관심을 갖고 있는 주제들과 관련된 단어들을 연관이슈로 자동 추천하는 방법을 제안했습니다. 대부분 영어 기반으로 진행 되었던 연관 단어 생성 연구와는 달리 한글 기반의 연구를 진행하였고 기존에 좋은 성능을 보인 LDA 기법과 비교실험을 진행하여 성능을 증명한 것이 흥미로웠습니다. 제가 발표를 하면서 여러 가지 부족한 점도 많이 느꼈고, 반면에 다른 사람들의 발표를 들으며 배울 점도 많이 봤습니다. 여기서 느낀 점들을 밑거름으로 하여 더욱 성장해서, 다음 번 발표에는 좋은 발표를 하고 싶습니다.

마지막으로, 교수님, 연구실 선배, 동기와 제주도에서 좋은 시간을 보낼 수 있어서 좋았습니다. 다음에도 같이 학회에 참석하여 좋은 시간을 보내고 싶습니다.


[참석 후기 - 송준호] PAKDD 2017

게시자: 배홍균, 2017. 6. 1. 오전 1:29   [ 2017. 10. 15. 오후 7:59에 업데이트됨 ]

제주도에서 2017 5 23일부터 26일까지 4일간 개최된 Pacific Asia Knowledge Discovery and Data Mining 에 참석하였습니다. 이 학회는 데이터 마이닝, 데이터웨어 하우징, 기계 학습, 인공 지능, 데이터베이스, 통계, 지식 엔지니어링, 시각화 등 모든 KDD 관련 분야의 새로운 아이디어, 독창적인 연구 결과 및 실제 개발 경험을 포함하는 다양한 주제를 다루고 있습니다.


이번 PAKDD 학회에서는 다양한 연구 분야에서 흥미로운 논문들이 발표되었습니다. 저는 그 중에서도 Social Network and Graph Mining 분야를 관심있게 보았습니다. 특히, 'Exploring Check-in Data to Infer Social Ties in Location Based Social Networks'라는 논문이 흥미로웠는데, 이는 Facebook, Twitter, Foursquare와 같은 SNS를 통해 사용자가 체크인을 수행하고 공유한 위치 데이터를 기반으로 실제 친구 관계인지 여부를 판단하는 내용이었습니다. 사용자의 위치 정보를 통해 만들어진 이동성 패턴을 기반으로 사용자 간의 관계를 파악할 수 있다는 점에 놀라웠습니다.


 

또한, 'Predicting Happiness State Based on Emotion Representative Mining in Online Social Networks'라는 논문 역시 눈길이 끌렸는데, 이 논문에서는 SNS 상에서 사용자의 행복의 정도를 예측하는 프레임 워크를 제안하였습니다. 사용자의 daily post text mining을 통해 분석하여 행복 상태를 정량화하고, 통계 분석을 기반으로 사용자의 행복의 정도가 이웃의 영향을 받는다는 것을 보였습니다. 마지막으로, 사용자의 행복의 정도에 큰 영향력을 찾는 알고리즘을 통해 이러한 사용자를 찾고, 이를 통해 예측 모델을 만들어 개개인의 사용자의 행복 상태를 예측하였습니다.

 

 
 

학회가 열린 제주도는 역시나 대한민국의 대표 휴양지로 너무나 아름다운 곳이었습니다곳곳에 탄성을 자아낼 만큼 눈부신 해변들이 손 뻗으면 닿을 듯 가까이 있었고너무나 훌륭한 음식들이 천지에 널려 있었습니다또한대한민국에서 가장 높은 산인 한라산의 백록담은 너무나 웅장했으며정상에서 바라보는 제주도는 너무나 찬란하게 아름다웠습니다한적한 사계 해변에서는 서핑을 즐기며 맥주 한잔을 하는 여유로움을 만끽하며 충분한 재충전의 시간을 가질 수 있었습니다.


끝으로, 학회 참석에 전폭적으로 지원해주시고, PAKDD 학회 기간과 CIKM 제출이 맞물려, 일정 중에도 논문 작성에 큰 도움을 주신 김상욱 교수님께 깊이 감사 드립니다


[참석 후기 - 채동규] WWW 2017

게시자: 배홍균, 2017. 4. 10. 오후 8:56   [ 2017. 10. 15. 오후 8:01에 업데이트됨 ]

호주 Perth에서 2017 43일부터 7일까지 5일간 개최된 International World Wide Web Conference에 참석하였습니다. 이 학회는 온라인 데이터를 기반으로 한 빅데이터 분석 및 서비스부터 웹 보안 이슈까지 world wide web과 관련된 다양한 주제를 다루고 있습니다. 올해로 26번째 개최를 이뤘으며, computer science 분야의 top conferences중 하나입니다.

저는 두 편의 포스터 논문을 발표하였습니다. 논문들의 제목은 각각 “A single step approach to recommendation diversification,” “On detecting frauds in comparison-shopping services” 입니다. 첫번째 논문은 추천 시스템이 상품을 추천할 때 정확한 추천 뿐만 아니라 다양한 추천을 할 수 있도록 만드는 것이 주제입니다. 기존 방법들이 취하던 2-step approach의 단점을 개선한 single-step approach를 제안하였으며, 기존 방법들에 비해 accuracydiversity가 모두 향상되었습니다. 두번째 논문은 가격비교 서비스에서 이상 사용자 (fraud) 를 찾는 논문입니다. 가격비교 서비스에서의 fraud를 새롭게 정의하고, fraud를 찾는 3가지의 signal을 제안하였습니다. 실제 가격비교 서비스의 데이터를 기반으로 제안하는 방법들의 성능을 평가하였습니다.

동시에 두 편의 포스터를 발표하는 것은 처음 해보는 경험이었습니다. 두 편 모두 의외로 많은 사람들이 관심을 보여서 이것저것 설명하느라 쉴 틈이 없었습니다. 다행히 학회측에서 두 포스터를 인접한 위치에 배치할 수 있도록 배려해 준 덕분에 한결 수월하게 발표할 수 있었습니다. 많은 연구원들이 질문을 하였고 사진을 찍어가는 연구원들도 많았습니다. 저도 틈이 생기면 다른 포스터 발표자에게 질문하며 지식을 얻기도 하였습니다.

이번 WWW 학회에서도 다양한 research track에서 흥미로운 논문들이 발표되었습니다. 저는 그 중 추천시스템 track에 집중하였습니다. 최근 추천 시스템에서는 딥러닝과 접목하려는 시도가 많이 이루어지고 있습니다. 이번 WWW에서도 그런 논문들이 많이 발표되었으며, 대표적으로 “Neural Collaborative Filtering,” “Collaborative Metric Learning,” “What Your Images Reveal Exploiting Visual Contents for Point-of-Interest Recommendation” 등이 흥미로웠습니다. 첫번째 논문은 기존의 matrix factorization을 통해 user-item interaction을 학습하던 것을 딥러닝으로 대신함으로써 더 깊이있는 학습이 되도록 하고, 결과적으로 추천의 정확도 향상을 이룬 논문입니다. 두번째 논문은 collaborative filteringmetric learning을 접목한 논문입니다. 이 논문은 item feature또한 추천에 활용하는데, item feature를 학습하기 위해 딥러닝을 이용하였습니다. 세번째 논문은 사용자가 SNS에 올린 사진들을 분석해서 point of interest를 학습하고, 이를 추천에 활용하자는 논문입니다. 이 때 SNS의 사진 분석에 딥 러닝을 활용하고 있습니다.

 

학회가 열린 도시인 Perth는 호주의 서쪽에 위치한 휴양도시입니다. 도시가 바다와 인접해있고 도시 안에는 각종 공원 및 정원, 동물원 등 자연 친화적인 공간이 많으며 높은 건물들이나 공사장, 발전소 등은 거의 없습니다. 그런 덕분에 도시의 어디에서도 녹색의 아름다운 풍경을 감상할 수 있었고, 공원에 가면 야생 앵무새, 공작새, 펠리칸, 캥거루 등 신기한 동물들을 가까이서 볼 수 있습니다. 대표적인 관광지인 Rottness Island에서는 아름다운 해변도로를 따라 자전거를 타며 여유를 만끽할 수 있었습니다.

끝으로 논문 작성에 큰 도움을 주신 상철선배, 그리고 연구 방향에 대한 조언, 논문 및 포스터 작성, 학회 참석 등에 전폭적으로 지원해주신 김상욱 교수님께 깊이 감사 드립니다.

[참석 후기 - 하지운 외 4명] NAVER X AI Colloquium

게시자: 배홍균, 2017. 4. 9. 오후 10:44   [ 2017. 4. 9. 오후 10:49에 업데이트됨 ]

NAVER X AI Colloquium은 네이버가 진행하고 있는 다양한 프로젝트와 노하우를 공유하는 행사로, 서울 그랜드 인터컨티넨탈 호텔 서울 파르나스에서 진행되었습니다.
이번 콜로퀴움은 검색, 콘텐츠 추천, 번역, 음성대화, 로봇, 자율주행차 등 네이버가 서비스하는 다양한 주제에 대한 발표가 진행되었습니다.
본 행사에는 우리 연구실의 하지운, 김형욱, 구장완, 이연창, 홍동균 학생이 참석하였습니다.


[홍동균]


제가 관심 있게 본 세션은 Recommendation 세션입니다. 이 세션의 첫 번째 발표로는 뉴스, 블로그, 웹툰, 동영상 등 네이버에서 제공하는 다양한 콘텐츠 추천에 활용되는 AiRS (AI Recommender System, 에어스) 개발에 대한 것이었습니다.


특히 AIRS는 기존 MF 모델 기반의 추천 알고리즘의 대표적인 한계로 1) 다양한 content feature를 동시에 고려하기 어려운 점, 2) sparsity 한 상황에서 latent feature를 생성하기 어려운 점을 설명하면서 이러한 한계를 딥러닝 모델을 사용하는 것으로 해결한다는 점이 흥미로웠습니다.

또 하나로는 AIRS 시스템 구조의 데이터 분산 처리 부분이었습니다. 네이버에서는 추천 시스템에 활용할 수 있는 대규모 데이터를 블로그, 카페 등의 서비스로 부터 얻을 수 있으며, 이러한 데이터를 효율적으로 계산하는 분산 처리 시스템에 대한 부분을 중요하게 고려하고 있었습니다.



[구장완]


NAVER X AI Colloquium에 참석하여 현재 네이버에서 진행하고 있는 다양한 연구들을 접할 수 있었습니다.

네이버에서는 이미지 검색 분야도 많은 연구를 진행하고 있었습니다. 이미지 검색을 구현하기 위해, 전통적인 검색 랭킹 모델링 기술에 딥러닝 기반 Visual Similarity를 접목했습니다. 기계학습 기반 Learning to Rank 기술을 이용하여 더 많은 질의를 Core Ranking에서 처리하도록 개발 중이라고 들었습니다.


이러한 연구는 포토요약, 타임라인, 유사 상품 찾기 등 다양한 분야에서 활용될 수 있기에 더욱 흥미로웠습니다. 최근에 CNN을 통해 이미지 처리 쪽에서는 상당한 발전을 이루었다고 생각했는데, 아직도 할 일이 많은 것 같습니다. 또한, 실생활에서 활용할 수 있는 여지가 많다는 생각에 더욱 관심이 갔습니다.

앞으로도 이러한 세미나와 강연들에 참석할 기회를 많이 가져, 최신 연구 동향과 실제 기업에서 활용되는 사례들을 다양하게 접할 수 있으면 좋겠습니다.



[하지운]


NAVER의 다양한 서비스들에서 AI 기술들이 실제로 어떻게 적용되고 있는지를 알 수 있는 흥미로운 행사였습니다. 특히, 데이터와 컴퓨팅 파워가 매우 풍부한 상황에서 다양한 AI 기술을 통해 해당 데이터들을 유용하게 사용하는 모습들은 연구를 하면서는 쉽게 접할 수 없는 부분들이었습니다.


그 중에서도 특히 관심이 갔던 부분은 검색 서비스와 추천 서비스였는데, 어느 서비스든 활용할 수 있는 컨텐츠 데이터를 최대한으로 활용하고, 그 과정에서 word2vec과 같은 word embedding 기술을 기본 요소로써 활용하고 있는 모습들이 인상적이었습니다. 또한, 실제 필드의 데이터는 저희가 연구를 하면서 사용하는 실험 데이터들보다 훨씬 더 sparse하기 때문에 평점 기반의 matrix factorization 기술로는 정확도를 얻기 어려우며, 컨텐츠 기반 추천 기술을 사용하는 것이 더 높은 정확도를 얻을 수 있다는 이야기도 흥미로웠습니다.

이 외에도 실제 서비스를 제공하는 입장에서의 다양한 의견들을 들을 수 있었고, 이를 통해 추천 기술 연구의 앞으로의 나아갈 방향에 대한 힌트를 얻을 수 있는 좋은 행사였습니다.

이러한 좋은 행사에 참여할 수 있도록 도와주신 김상욱 교수님께 감사의 말씀을 드립니다.


[이연창]


최근 우리 분야의 탑 컨퍼런스에 네이버의 논문들이 자주 등장하고, 올해에는 NAVER LABS가 독립법인이 되었습니다. 이러한 뉴스들을 통해 기술 연구에 대한 네이버의 투자가 상당하다는 것을 느끼고 있던 와중에, 이러한 콜로퀴움을 개최한다는 소식에 매우 기대를 가졌습니다.

기대한 대로, 네이버는 자체 플랫폼 내에서 제공하는 다양한 서비스 (예: 검색, 추천, 로보틱스, 자율주행차) 에 최신 기술들을 적용할 뿐만 아니라, 꾸준히 최신 연구 결과들을 서베이해오고 있었습니다.

그 중 가장 흥미로웠던 부분은 이미지 클러스터링을 위해 활용한 locally optimized product quantization (LOPQ) 모델입니다. 해당 모델은 k-means 클러스터링의 여러 단점들을 극복하기 위해 제안된 product quantization (PQ) 모델을 개선한 버전으로, 최근접 이웃들을 approximate하게 찾는 기술입니다. 클러스터링을 하기 위해 quantizer를 활용하는 방안에 대한 연구들이 꽤 있다는 사실을 새롭게 알게 되었고, 저희 연구실에서 수행하는 다양한 연구에 활용 가능할 것 같습니다.


한 가지 아쉬웠던 점은 가장 관심을 가지고 있었던 ‘추천’ 세션에서 디테일한 기술 설명이 없었다는 점입니다. 네이버가 워낙 다양한 분야를 커버하고 있고 그 분야 전체를 포괄하는 내용들을 발표하는 자리이다 보니, 각 분야에 대한 디테일한 설명은 약간 부족했던 것 같습니다. 그러나, 대략적이나마 산업에서 실제 서비스들에 어떤 기술들이 적용되는지 알 수 있는 유익한 시간이었습니다. 지식 공유와 인적 교류를 위해 좋은 행사를 개최해 준 네이버 개발자 분들에게 감사하며, 이러한 좋은 행사에 참여할 수 있는 기회를 주신 김상욱 교수님께도 감사드립니다.


[김형욱]


Naver AI colloquium 참석하여 Naver에서 진행하고 있는 다양한 연구들에 대해서 간략한 설명을 들었습니다. 저는 추천 세션을 흥미 있게 들었습니다.

음악 추천 관련된 발표에서는 협업 필터링이 일반적으로 가지는 challenge 'sparsity', 'scalability', 'diversity' 외에 'Top-100 듣는 사용자', '계절적 특징을 갖는 음악 (e.g. 벚꽃 엔딩, all I want for Christmas is you)', '유저 context' 등과 같은 음악 추천 도메인이 갖는 흥미로운 challenge 소개하였습니다.  

또한, 딥러닝을 활용하는 개인화 상품 추천 발표에서는 상품 구매 내역이나 상품 검색 로그와 같은 도메인 정보뿐만 아니라 네이버의 다른 서비스들을 통해 얻은 다른 도메인 정보들 (e.g. 네이버 검색 로그, 뉴스 클릭 로그) 함께 활용하는 크로스오버 추천에 대한 설명이 흥미로웠습니다.

이번 colloquium 통해서 추천 시스템이 실제로 활용되는 사례들도 많이 접할 있어서 좋았고, 앞으로도 이런 기회가 많으면 좋을 같습니다.




20170407_132257.jpg    

[참석후기 - 김나영] ICGHIT 2017

게시자: 송준호, 2017. 2. 23. 오전 3:27   [ 2017. 2. 26. 오후 5:14에 업데이트됨 ]



International Conference on Green and Human Information Technology (ICGHIT)가 2017년 2월 15일부터 2월 17일까지 중국 항저우에서 개최되었습니다.
ICGHIT는 크게 6개의 세션으로 나뉘어져 있었고, 그 중에서 Green Information Technology 세션에 참여하였습니다.


 

저는 ‘Analyzing Suicide-Ideation Survey to Identify High-Risk Groups: A Data Mining Approach’라는 논문을 발표하였습니다. 
자살이라는 사회문제 중 하나인 자살에 대하여 데이터 마이닝 기법을 통해 자살 충동 원인을 파악하고, 나아가 자살 충동 위험이 높은 군집을 찾은 연구입니다.

첫 학회이기도 하면서 국제 학회여서 설레기도 하고 한편으로는 걱정도 많이 되었습니다. 비교적 이른 리허설로 발표하는 날까지 5일이라는 시간이 남았습니다. 
이 시간 동안 교수님과 선배들에게 발표 내용과 발표 자료 작성에 대한 많은 조언을 받고, 이를 바탕으로 발표 연습을 반복적으로 했습니다. 
처음에는 발표가 어색하고 실수가 많았지만 많은 연습 덕분에 발표가 익숙해져 실전에서는 발표에 대한 부담을 덜 수 있었습니다. 
노력과 더불어 교수님께서 논문부터 발표 자료까지 꼼꼼하게 봐주신 덕분에 best paper award라는 좋은 결과까지 얻을 수 있었습니다.

학회가 진행되는 동안 많은 연구들도 찾아 들었습니다. 그 중에서 저는 “Detection of DDoS Attack Using SVM with Important Attributes on the Client Side” 라는 연구에 대해서 관해서 관심 있게 들었습니다. 
SVM을 이용하여 DDoS의 주된 특징을 알아내고, DDoS의 공격을 탐지하는 방법을 제안한 논문이었습니다.

이번 학회가 개최된 항저우는 제가 생각한 중국과는 거리가 멀었습니다. 거리에는 높은 빌딩과 대규모 쇼핑몰들이 가득했고, 또 깨끗했습니다. 
하지만 현지 사람들이 영어를 거의 할 줄 몰라 의사소통의 어려움을 겪기도 했습니다. 학회가 끝난 이후에는 쇼핑몰을 돌아다니고, 식당에서 많은 현지 음식을 맛보았습니다.

  

끝으로 연구 방향이 올바르게 진행될 수 있도록 이끌어 주시고, 이번 학회에 참석할 수 있도록 기회를 주신 김상욱 교수님께 감사 드립니다. 
또한 연구 진행하는 데에 많은 도움을 주신 김한성 교수님께도 감사 드립니다. 
마지막으로, 연구를 진행하는 동안 부족한 저를 이끌어 주시고, 많은 조언을 아끼지 않으신 지원선배에게도 감사의 인사를 전합니다.



1-10 of 30