본문 바로가기

분류 전체보기6

Unlocking the Potentials of Retrieval-Augmented Generation for Diffusion Language Models https://arxiv.org/abs/2601.113420. AbstractDiffusion Language Models (DLMs) have recently shown promising capabilities in natural language processing with iterative refinement and parallel decoding, but integrating Retrieval-Augmented Generation (RAG)—a key technique for improving factual grounding in large language models—has not been systematically explored for DLMs.This paper thoroughly inves.. 2026. 1. 20.
The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents https://arxiv.org/abs/2601.114960. AbstractThe growing deployment of AI agents in economic environments is reshaping how markets operate and how strategic interactions unfold.This paper studies a subtle but powerful phenomenon that arises when AI agents are allowed to expand the set of available technologies within a regulated or mediated market.The authors identify what they call the “Poisoned .. 2026. 1. 20.
A Unified Shape-Aware Foundation Model for Time Series Classification https://arxiv.org/abs/2601.064290. AbstractTime series classification remains a challenging task due to strong domain dependency, varying temporal scales, and diverse signal morphologies.While deep learning models have significantly improved performance, most existing approaches are still trained per dataset and fail to generalize across domains.This paper introduces a unified shape-aware founda.. 2026. 1. 20.
All-Optical Deep Learning with Quantum Nonlinearity https://arxiv.org/abs/2601.016900. Abstract최근 딥러닝 모델의 규모가 급격히 커지면서, 성능 못지않게 전력 소비와 연산 효율성이 중요한 문제로 떠오르고 있다.특히 대규모 모델의 추론 단계는 데이터센터 단위의 에너지 비용과 직결되며, 기존 디지털 연산 기반 구조의 한계를 점점 명확히 드러내고 있다.본 논문은 이러한 한계를 알고리즘 최적화가 아닌 물리적 구조 설계를 통해 해결하고자 한다.구체적으로는 광학(optical) 기반 신경망에 양자 비선형성(quantum nonlinearity)을 결합하여,극도로 낮은 전력 소비 환경에서도 비선형 딥러닝 연산이 가능함을 실험적으로 보였다. 1. 연구 배경: 왜 광학 기반 딥러닝인가기존 딥러닝 연산은 대부분 전자 기반 디지털 회로 위에.. 2026. 1. 20.
State Space Models for Long-Context Deep Learning 0. AbstractTransformer 기반 딥러닝 모델은 지난 수년간 자연어 처리, 시계열 분석, 멀티모달 학습 전반에서 표준 구조로 자리 잡아왔다.그러나 self-attention 메커니즘은 입력 길이에 따라 계산량과 메모리 사용량이 급격히 증가한다는 구조적 한계를 가진다.2026년 발표된 본 논문은 이러한 한계를 해결하기 위해 State Space Model(SSM) 기반 딥러닝 아키텍처를 대규모로 확장하고,이를 통해 초장문(Long Context) 입력에서도 안정적이고 효율적인 학습과 추론이 가능함을 보인다.본 리뷰에서는 해당 논문의 문제의식, 핵심 구조, 실험 결과, 그리고 딥러닝 아키텍처 관점에서의 의미를 정리한다.1. 연구 배경: Attention 중심 딥러닝의 한계Self-attentio.. 2026. 1. 17.
Test-Time Adaptation via Distribution-Aware Recalibration 0. Abstract머신러닝 모델은 일반적으로 학습 이후 고정된 상태로 배포되며, 테스트 단계에서는 더 이상 모델이 변화하지 않는다는 가정을 전제로 한다.그러나 실제 환경에서는 학습 데이터와 테스트 데이터 간 분포 차이(distribution shift)가 빈번하게 발생하며, 이는 모델 성능 저하의 주요 원인이 된다.2026년 기준 최신 연구 흐름에서는 이러한 문제를 해결하기 위해 Test-Time Adaptation(TTA) 기법이 다시 주목받고 있다.본 논문은 테스트 단계에서 라벨 없이 입력 데이터의 분포를 분석하고, 출력 및 내부 표현을 재보정(recalibration)함으로써 모델의 일반화 성능을 유지하는 방법을 제안한다. 1. 문제 배경: Distribution Shift의 현실성머신러닝 모델은.. 2026. 1. 17.