본문 바로가기
반응형

분류 전체보기33

[Survey Review] LLM으로 '가상 인간'을 만든다? 대화형 사용자 시뮬레이션 완전 정복 가이드 (EACL 2026) 여러분, 이런 상상을 해보신 적 있으신가요? "ChatGPT를 테스트하고 싶은데, 수천 명의 사람을 직접 섭외하지 않아도 된다면?"AI 시스템을 평가하거나 학습시키려면 방대한 양의 사람과의 대화 데이터가 필요합니다. 그런데 실제 사람을 쓰면 비용이 막대하고, 프라이버시 문제도 생기죠. 여기서 등장한 핵심 기술이 바로 '사용자 시뮬레이션 User Simulation'입니다. 즉, AI가 사람처럼 대화하는 '가상 사용자'를 만들어 내는 것이죠.그런데 최근 LLM(대형 언어 모델)의 등장으로 이 분야가 폭발적으로 성장하고 있습니다. 이번에 소개할 논문은 EACL 2026에 발표된 "A Survey on LLM-based Conversational User Simulation"입니다. Vanderbilt Uni.. 2026. 4. 11.
[Survey Review] AI가 1,000페이지 문서를 이해하는 법 — Multimodal RAG 완전 정복 가이드 (2025) 📌 핵심 키워드: Multimodal RAG, 문서 이해, LLM, VLM, ColPali, Document AI, 검색 증강 생성🚀 도입부: "AI가 두꺼운 책을 읽지 못한다고요?"여러분, 한 번 상상해보세요. 1,000페이지가 넘는 재무보고서를 보면서 특정 수치를 찾아야 하는 상황을요. 사람이라면 목차를 보고, 원하는 챕터로 넘어가고, 눈으로 훑으면서 빠르게 원하는 정보를 찾아냅니다. 그런데 지금의 AI는 어떨까요?GPT-4나 Claude 같은 최신 대형 언어 모델(LLM)도 사실 "컨텍스트 윈도우(Context Window)"라는 한계가 있습니다. 쉽게 말해, 한 번에 읽을 수 있는 글자 수가 정해져 있다는 뜻입니다. 128K~1M 토큰이라고 해도, 수십 MB짜리 PDF 문서 앞에서는 금방 "C.. 2026. 4. 11.
[공지] AI 연구원 LIMI_Lab의 시작: 지식의 융합을 기록합니다. 안녕하세요. AI 연구원 LIMI_Lab입니다.그동안 조용히 방치되어 있던 공간을 새롭게 단장하고, 저의 연구와 프로젝트를 본격적으로 기록하기 위해LIMI의 AI 컨버전스 연구소로 문을 열었습니다.오늘은 이 연구소의 첫 번째 기록으로, 앞으로 이곳에서 어떤 이야기들을 나누게 될지 짧은 오리엔테이션을 가져보려고 합니다. 📍 Who is LIMI_Lab저는 현재 AI Convergence 전공의 박사 수료 연구원입니다.주로 자연어처리, RAG 시스템 그리고 복잡한 데이터 전환 메커니즘을 깊게 탐구하고 있습니다.저의 연구는 실험실에만 머물지 않습니다. 현재 이주다문화 관련 연구소에서 인문사회 영역의 빅데이터를 AI 시스템과 연결하는 작업을 병행하며,기술이 실제 사회의 문제를 어떻게 해결할 수 있을지 고민하는.. 2026. 4. 11.
“나는 오늘도 살아 있어서 연장을 들었다” – 늙은 킬러가 전하는 생의 찬가, 『파과』 살아 있어서 눈을 떴고, 그래서 오늘도 하루를 시작했다.그 시작이 ‘희망’이나 ‘의지’가 아닌 그저 살아 있기 때문이라는 말이,어쩐지 더 오래 가슴에 남는다.처음 이 책을 펼친 건 솔직히 그 강렬한 설정 때문이었다.“60대 여성 킬러”라니, 안 끌릴 수가 없잖아요?하지만 『파과』는 단순한 액션도, 짜릿한 반전도 아닌,조용히 무너져가는 존재와 그 안에서 피어나는 온기에 대한 이야기였어요. 🧍‍♀️ 삐걱거리는 몸과 기억, 그리고 남겨진 존엄“하지만 몸도 기억도 예전 같지 않게삐걱거리면서 이제는 퇴물 취급을 받는다.”이 책의 주인공 조각은 청부살인을 업으로 삼아온 60대 여성 킬러입니다.하지만 나이가 들어 몸은 느려지고, 기억도 가물가물해지고,한때는 “전설”이었지만 이젠 퇴물이라 불리는 처지가 되었죠.그녀는.. 2025. 7. 1.
[2018] Hate Lingo: A Target-Based Linguistic Analysis of Hate Speech in Social Media 논문 정보제목: Hate Lingo: A Target-Based Linguistic Analysis of Hate Speech in Social Media저자: Mai ElSherief, Vivek Kulkarni, Dana Nguyen, William Yang Wang, Elizabeth Belding소속: University of California, Santa Barbara발간지: ICWSM 2018 Introduction소셜 미디어는 표현의 자유를 증진시키는 순기능을 하지만 동시에 온라인 괴롭힘, 사이버불링, 혐오 발언과 같은 반사회적 행동의 온상이 되기도 한다. 이 연구는 기존의 혐오 발언 연구들이 간과해 온 매우 중요한 측면인 ‘혐오 발언의 '대상(target)’에 집중하여 온라인 혐오 발언.. 2025. 6. 23.
[2017] Automated Hate Speech Detection and the Problem of Offensive Language 논문 정보제목: Automated Hate Speech Detection and the Problem of Offensive Language저자: Thomas Davidson, Dana Warmsley, Michael Macy, Ingmar Weber소속: Cornell University, Qatar Computing Research Institute발간지: ICWSM 2017 Introduction온라인상의 혐오 발언(Hate Speech)과 단순히 공격적인 언어(Offensive Language)를 어떻게 구분할 수 있을까? 이 논문은 이 질문에 대한 깊이 있는 탐구를 시작한다. 저자들은 혐오 발언을 "특정 집단을 향해 경멸, 모욕, 굴욕감을 주기 위한 의도를 가진 언어"로 정의하고 이것이 단순히.. 2025. 6. 20.
[Methods] Deep Learning for Hate Speech Detection in Tweets (2017) 소셜 미디어에 만연한 혐오 발언과 악플은 이제 심각한 사회문제이다. 수많은 콘텐츠를 사람이 일일이 검수하는 것은 불가능에 가깝기 때문에 인공지능을 활용한 자동 탐지 기술이 필수적이다. 2017년에 발표된 "Deep Learning for Hate Speech Detection in Tweets"는 이 분야의 기술적 발전에 중요한 이정표를 제시한 논문이다.이 논문에서는 다양한 방법론들을 제시하였는데, 그에 대해 하나하나 살펴보았다. 1. Baseline 방법들새로운 기술의 성능을 제대로 평가하려면 비교할 기준점이 필요하다. 연구팀은 당시 널리 사용되던 세 가지 베이스라인 방법들을 먼저 실험하였다.문자 n-gram (Character n-gram): 당시 혐오 발언 탐지 분야의 최신 기술로 여겨지던 방식.. 2025. 6. 18.
[2017] Deep Learning for Hate Speech Detection in Tweets 논문 정보제목: Deep Learning for Hate Speech Detection in Tweets저자: Pinkesh Badjatiya, Shashank Gupta, Manish Gupta, Vasudeva Varma소속: IIIT-H (Hyderabad, India), Microsoft (India)발간지: WWW 2017 Companion 1. Introduction소셜 미디어의 폭발적인 증가와 함께 혐오 발언 또한 증가하면서 이를 악용한 혐오 활동 역시 크게 늘어났다. 트위터에서 혐오 트윗은 특정 개인(정치인, 연예인 등)을 향한 사이버불링이나 특정 집단(국가, 종교, 성별, 성소수자 등)을 표적으로 하는 공격적인 언어를 포함한다. 이러한 혐오 발언을 탐지하는 것은 특정 사용자 ㄷ그룹이 다.. 2025. 6. 17.
반응형