Neural Networks for Infomation Retrieval (2018)
Abstact
Machine Learning, Deep learning은 modern IR systems에서도 중요한 역할을 맡고 있다.
이 분야에서 새로운 정보들이 쏟아지고 있기 때문에
이 tutorial에서 과거에 시도되었던, 효과가 있었떤 IR 방법들에 대한 overview를 제공한다
Motivation
IR pipeline들에 Neural Networks가 사용되고 있다
- click models, core ranking algorithms, dialogue systems, entity retrieval
- Knowledge Graphs, Language Modeling, Question Answering, Test Similarity
많은 구조들과 패러다임들이 제안되고 사용되었다.
- auto-encoders, Recursive NN, RNN, CNN
- 다양한 embedding methods, deep reinforcement learning
Brief outline of the topics to be covered
◇ Preliminaries
- distributed representations / embeddings
- fully-connected layers, convolutional layers
- RNN, seq2seq model
◇ Semantic Matching
- 기존의 방식은 lexical matching (같은 단어 출현 여부를 matching)
- 하지만 단어는 context에 따라 다양한 뜻을 표현 가능하므로 semantic matching을 해야 한다
- supervised fashion, semi-sypervised, unsupervised <ref>
◇ Learning to Rank
- ranking을 메기기 위해서는 query, documentation, 그리고 둘의 관계에 대한 다양함을 포착해야 한다
- NN model에서 query, document는 수동적으로 처리되어 feature들로 표현되고, 목적에 따라 이 둘을 combine
- 학습 과정을 통해서 latent representation이 학습됨
- supervision/unsupervised, semi/weakly-supervised, fully-supervised(labeled data, interaction data) <ref>
◇ Entities
- Entities는 IR system에서 핵심적인 역할을 한다
- Named Entity Recognition, Expert finding, Product Search, email attachment, graph embedding <ref>
◇ Recommender Systems
- item(products, users) embeddings <ref>
- deep collaborative filtering <ref>
◇ Modeling User Behavior
- click models based on Probabilistic Graphical Models (PGMs) <ref>
- click models using RNN/PGM-based click model <ref>
◇ Generating Responses
◇ Industry Insights
'AI - NLP > Articles' 카테고리의 다른 글
XML-Roberta 기반 한국어 기계독해 기법 (2020) (0) | 2020.12.17 |
---|---|
KorSciQA 한국어 논문의 기계독해 데이터셋 (2019) (2) | 2020.12.17 |
BERT를 이용한 한국어 특허상담 기계독해 (2020) (0) | 2020.12.17 |
Information Retrieval System and Machine Translation: A Review (2016) (0) | 2020.12.11 |
Review: Information Retrieval Techniques and Application (2015) (0) | 2020.12.11 |