엠아이앤뉴스

검색

1 / 1

" 이정우 교수팀"으로 검색하여, 1 건의 기사가 검색 되었습니다.

서울대, 서울공대 전기정보공학부 이정우 교수팀이 거대언어모델에 적용 가능한 강화학습 신기술 개발

2025-08-04

▲ 서울공대 전기정보공학부 이정우 교수팀(왼쪽부터 서울대학교 전기정보공학부 이정우 교수, 조태현 연구원, 주석훈 연구원, 한승엽 연구원) [출처=서울대학교 공과대학]서울대(총장 유홍림) 공과대학(학장 김영오, 이하 서울공대)에 따르면 전기정보공학부 이정우 교수 연구팀이 챗지피티(ChatGPT)와 같은 거대언어모델에 적용 가능한 강화학습 신기술을 개발했다.해당 기술을 제안한 논문은 인공지능(AI) 이론 분야 국제학술대회 ‘ICML 2025’에서 전체 제출작 중 상위 2.6퍼센트(%)에 해당하는 ‘스포트라이트(Spotlight)’ 논문에 선정됐다.이정우 교수가 창업한 AI 자동학습 플랫폼 기업 ‘호두에이아이(HodooAI)’는 2025년 7월13일(일)부터 20일(일)까지 캐나다 밴쿠버에서 열린 ‘ICML 2025(International Conference on Machine Learning, 국제 기계학습학회)’에서 ‘Policy-labeled Preference Learning: Is Preference Enough for RLHF’ 제하의 논문을 발표한 바 있다.이번 논문이 AI 분야 최고 권위 학회에서 상위 2.6%의 스포트라이트 논문으로 채택된 쾌거는 서울대 CML(Cognitive Machine Learning Lab) 연구실 및 호두에이아이의 자연어 처리 관련 AI 첨단 기술력을 국제적으로 입증했다는 점에서 의미가 깊다는 평가를 받고 있다.◇ 연구 배경... 기존 RLHF의 한계로 성능에 악영향 발생ChatGPT 같은 거대언어모델(Large Language Models)이 사용자와 소통할 때 인간 가치에 정합하는 문장, 즉 실제 사람이 쓰는 수준 높은 문장을 쓰도록 유도하기 위해 ‘인간 피드백 기반 강화학습(Reinforcement Learning from Human Feedback, RLHF)’이라는 훈련법이 사

주간 HOT ISSUE