1 / 1
" 학습 데이터"으로 검색하여,
4 건의 기사가 검색 되었습니다.
-
▲ 서울대학교 컴퓨터공학부 강유 교수[출처=서울대학교 컴퓨터공학부]서울대학교(총장 유홍림) 공과대학(학장 김영오)에 따르면 컴퓨터공학부 강유 교수팀이 개인정보 보호나 보안 등의 이유로 학습 데이터 사용이 어려운 상황에서도 딥러닝 모델의 성능 저하를 최소화하며 경량화할 수 있는 혁신적인 인공지능(AI) 기술을 개발했다.이번 연구 논문은 2025년 4월24일부터 닷새간 싱가포르에서 열리는 세계적 AI 학술대회 ‘ICLR 2025’에 채택된 바 있다.올해로 13회를 맞는 ‘ICLR (International Conference on Learning Representations)’은 기계 학습 및 딥러닝 분야에서 세계 최고 권위를 자랑하는 학회다.프라이버시 보호나 보안 문제로 학습 데이터 접근이 어려운 상황은 현실에서 딥러닝 모델을 훈련시킬 때 겪는 큰 어려움 중 하나다.이를 해결하기 위해 개발된 ‘제로샷 양자화(Zero-shot Quantization, 이하 ZSQ)’는 훈련 데이터 없이 모델을 양자화할 수 있는 기술이다.그러나 기존의 ZSQ 기술은 합성 데이터의 노이즈, 부정확한 특징에 기반한 예측, 어려운 데이터의 잘못된 하드 레이블(Hard Lavel, 1가지 정답만 있는 레이블)이 야기하는 오차 발생 등으로 모델 성능 저하를 불러오는 치명적 한계를 보였다.이에 강 교수팀은 훈련 데이터를 사용하지 않고도 딥러닝 모델의 성능을 유지하며 효과적으로 경량화시킬 수 있는 ZSQ 기술인 ‘SynQ (Synthesis-aware Fine-tuning for Zero-shot Quantization)’ 기법을 제안했다.이는 실제 학습 데이터셋이 없는 환경에서도 종전의 ZSQ 기술에 쉽게 적용할 수 있는 중요한 기법으로 평가받고 있다.연구진은 SynQ의 3가지 핵심 기술로 딥러닝 모델의 성능을 향상시켜 기존 ZSQ의 약점을 극복하는 성과를 거뒀다.먼저 저역 통과 필터(low-pass filter)를 적용해 데이터의 고주파 노이즈를 제거했다. 그리고 사전 학습된 모델과 양자화된 모델 사이의 클래스 활성화 맵(Class Activation Map, 이하 CAM)을 정렬해 딥러닝 모델의 예측 정확도를 높였다.아울러 사전 학습된 모델이 어려운 샘플에 대해 오류를 일으킬 수 있는 점을 고려해 이러한 샘플에는 하드 레이블 대신 소프트 레이블(Soft Rabel, 확률로 표현된 정답)만을 사용함으로써 잘못된 학습을 방지했다.즉 SynQ는 사전 학습된 모델이 생성한 합성 데이터를 저역 통과 필터로 정제한 뒤 CAM 정렬과 난이도 기반 손실 함수 적용을 통해 양자화된 모델을 미세 조정함으로써 실제 데이터 없이도 모델 성능을 유지하며 경량화를 달성하는 원리를 지닌다.향후 SynQ 기법은 고성능의 경량 딥러닝 모델을 구현할 수 있는 AI 산업의 핵심 기술로 자리 잡을 전망이다. 특히 학습 데이터 없이도 모델의 정확도를 유지한 채 압축할 수 있는 SynQ를 활용하면 스마트폰, IoT(사물인터넷) 기기, 자율주행 센서 등 자원이 제한된 엣지 디바이스 환경에서도 고성능 AI를 안정적으로 운용할 수 있을 것으로 예상된다.연구 책임자인 강유 교수는 “SynQ 기술은 개인 데이터 유출 없이 모델을 경량화할 수 있는 강점 덕분에 보안 및 프라이버시 침해 문제를 줄이는 데 기여할 수 있다”고 강조하며 “나아가 이 기법을 적용하면 그간 대량의 학습 데이터에 접근하기 어려웠던 소규모 기업 및 기관도 고성능 AI를 손쉽게 활용할 수 있기 때문에 다양한 분야에서 AI 기술 확산 및 대중화가 가속할 것으로 기대된다”고 밝혔다.
-
2025-04-08▲ 그랜데이터 참여사들이 신규 참여사 이마트와 업무 협약식을 맺고 기념 촬영하는 모습(왼쪽부터 박준 SKT AI Intelligence사업본부장(부사장), 박창석 신한카드 전략사업그룹장(부사장), 고현덕 KCB CB사업부문장, 장성욱 카카오모빌리티 미래사업실장(부사장), 정우진 이마트 마케팅 담당, 이철행 SK브로드밴드 AT/DT개발실장) [출처=SK텔레콤]신한카드(사장 박창훈)에 따르면 2025년 4월3일(목) 서울 중구에 위치한 SKT타워에서 그랜데이터 회원사 확대 업무협약을 체결했다.또한 글로벌 인공지능(AI) 데이터 클라우드 기업 스노우플레이크(Snowflake)와 함께 ‘그랜데이터 X 스노우플레이크 세미나’를 개최하고 국내외 데이터 비즈니스 확장에 나섰다.그랜데이터(GranData)란 국내 최초의 민간데이터댐 사업으로 이날 협약식과 함께 개최된 세미나는 신한카드, SK텔레콤, 코리아크레딧뷰로(이하 KCB), SK브로드밴드, 카카오모빌리티, 이마트 등 그랜데이터 회원사와 각종 기업 및 기관 관계자들이 참석했다.신한카드, SK텔레콤, KCB 3사를 중심으로 2021년 출범한 그랜데이터는 개방형 얼라이언스 형태로 참여 기업을 지속 확대해왔다.2023년 SK브로드밴드의 참여로 방송 분야의 데이터가 더해졌고 이외에도 공공 민간 데이터를 보유, 활용하는 여러 기업 및 기관들과 데이터 파트너십을 구축했다.이를 토대로 카드, 통신, 신용 정보 등 다양한 이종 산업 데이터를 결합해 공공정책 분석 및 수립, 마케팅 성과 분석, AI 학습 데이터 생성 등 실질적인 성과를 창출하며 국내 데이터 산업 발전에 기여하고 있다.이번 업무협약으로 카카오모빌리티, 이마트가 새롭게 합류하며 모빌리티 및 유통 품목 데이터 등 신규 이종 데이터 활용이 가능해져 그랜데이터 사업에 시너지를 낼 것으로 기대된다.이와 함께 그랜데이터는 스노우플레이크와 협력해 공동 세미나를 개최했다. 스노우플레이크는 1만1000개 이상의 글로벌 기업이 사용하는 데이터 클라우드 플랫폼으로 현재 다양한 국가와 산업군의 클라우드 기반 AI 및 데이터 분석에 활용되고 있다.이번 세미나는 클라우드 분석을 활용하는 국내외 기업을 대상으로 데이터 비즈니스를 확대하고자 그랜데이터 회원사와 스노우플레이크가 함께 추진했다. 세미나에 참석한 다양한 업종의 기업과 공공기관을 대상으로 그랜데이터를 소개하는 시간을 가졌다.특히 이날 세미나에서는 그랜데이터가 보유한 유동인구, 카드 소비, 신용 정보 등 주요 데이터를 스노우플레이크의 클라우드 플랫폼상에서 분석하는 시연이 이뤄졌다.그랜데이터는 데이터 표준화, 정규화 등을 통해 이용자 입장에서 통합 분석이 가능하도록 설계돼 있어 클라우드 환경하에서 그 확장성과 효율성이 더욱 높아질 수 있다는 특징이 있다.신한카드는 이번 협업을 통해 그랜데이터의 데이터를 스노우플레이크 플랫폼에서 더욱 유연하게 활용할 뿐만 아니라 국내를 넘어 해외 데이터 사업에 적용하는 등 데이터 판매 채널로서 가능성까지 모색할 계획이다.신한카드는 그랜데이터를 비롯해 마이데이터, 개인사업자 CB, 데이터전문기관, 데이터 비즈니스 플랫폼 ‘데이터바다(DataBada)’ 등 다양한 데이터 사업을 영위하며 쌓은 노하우와 국내 최고 수준의 분석 역량을 바탕으로 공공기관 및 민간 기업, 글로벌 기업에 양질의 데이터와 솔루션을 제공하고 있다.
-
▲ 왼쪽부터 서울대학교 기계공학부 김도년 교수(교신저자), 김재훈 박사(공동 주저자), 임재경 박사(공동 주저자, 현 삼성전자 근무)[출처=서울대학교 공과대학]서울대학교(총장 유홍림) 공과대학(학장 김영오)에 따르면 기계공학부 김도년 교수 연구팀 논문이 반도체 운영 분야 국제 학술지 ‘IEEE Transactions on Semiconductor Manufacturing (이하 IEEE TSM)’에서 2024년 최우수논문상(Best Paper Award)을 수상했다.해당 분야의 가장 권위 있는 저널 중 하나인 IEEE TSM은 반도체 공정 및 생산 관련 최신 기술과 응용을 다루며 1년 동안 해당 저널에 게재된 논문들 중 가장 우수한 1편을 최우수 논문(Best Paper)으로 선정해 시상한다.김도년 교수팀의 또 다른 논문은 2021년 IEEE TSM에서 우수 논문(Best Paper Award: Honorable Mention) 3편 중 하나로 선정된 바 있다. 3년 만에 같은 저널에서 최우수논문상을 수상하는 쾌거를 이뤘다.연구팀은 ‘Hotspot Prediction: SEM Image Generation with Potential Lithography Hotspots’ 제하의 이번 논문에서 리소그래피 공정 중 결함이 발생할 수 있는 취약 부위를 리소그래피 패턴 정보만으로 미리 예측할 수 있는 딥러닝 기술을 제시했다.이는 취약 부위에 대한 선제적인 설계 변경 등을 통해 반도체 생산 수율을 높이고 비용은 줄일 수 있는 핵심 기술이라는 평가를 받고 있다.논문의 주저자인 김재훈 박사는 “뜻깊은 상을 받게 돼 큰 영광이며 함께 연구에 참여하신 모든 분들께 감사드린다”고 인사를 전하며 “이번 성과를 발판 삼아 반도체 공정의 계측 및 검사 기술에 관한 연구에 정진하겠다”고 밝혔다.김재훈 박사는 현재 서울대 기계공학부에서 박사후연구원으로서 연구 활동을 이어가고 있다. 특히 적은 데이터만으로도 학습이 가능한 딥러닝 모델을 개발하고 실제 산업 현장에서도 활용되도록 그 응용 범위를 확장하는 연구를 진행 중이다.공동 주저자인 임재경 박사는 “이번 연구 결과가 2024년 최우수 논문으로 선정돼 매우 기쁘며, 연구를 지원해주신 많은 분들께 고맙다는 말씀을 드리고 싶다”며 “앞으로 반도체 제조 분야의 발전을 위해 지속적으로 노력하겠다”고 각오를 밝혔다.서울대 기계공학부에서 박사 학위를 취득한 임재경 박사는 현재 삼성전자 DS 부문에서 주사현미경과 전자빔 검사를 활용해 반도체 불량을 검출하는 업무를 수행하고 있다.◇ 참고 자료- 상: 2024 IEEE Transactions on Semiconductor Manufacturing Best Paper Award- 논문명: Hotspot Prediction: SEM Image Generation with Potential Lithography Hotspots- 논문저자: 김재훈*, 임재경*, 이진호, 김태연, 남윤형, 김기현, 김도년 (*공동 제1저자)
-
▲ 케냐 민간부문연합인 KEPSA(Kenya Private Sector Alliance) 로고케냐 민간부문연합(Kenya Private Sector Alliance·KEPSA)에 따르면 2021년 온라인 직업에 종사하는 사람은 최소 120만명인 것으로 집계됐다. 설문조사 결과 대다수는 비정규직으로 일하는 것으로 조사됐다.케냐는 인도, 필리핀과 같은 온라인 작업 허브국으로 부상하고 있다. 미국 실리콘밸리의 기업이 인공지능(AI) 학습에 필요한 데이터 입력 업무를 의뢰하면 케냐의 프리랜서가 온라인으로 처리한다.2000년 말 이후 기술 스타트업의 기술 아웃소싱 업무가 증가하고 사업친화적인 정책, 숙련된 인력, 초고속 인터넷을 기반으로 젊은층의 디지털 산업 종사자가 더욱 늘어나는 것으로 조사됐다.한편 1시간당 US$ 2달러 이하의 적은 돈을 벌기 위해 정신적 괴로움을 겪었다는 부정적인 면도 지적됐다. 챗GPT(ChatGPT)가 해로운 콘텐츠를 구별할 수 있도록 잔혹한 텍스트를 검색해 데이터 라벨링 작업을 거쳐야 하기 때문이다.정보통신기술(ICT) 전문가들은 케냐가 아웃소싱에서 그치지 않고 AI 개발 허브로 성장하기 위해서는 안정적인 전력 공급과 교육 시스템의 변화가 필요하다고 조언한다.
1