본문 바로가기
반응형

전체 글42

파인튜닝(Fine-Tuning)이란? 사전 학습된 인공지능 모델의 가중치를 새로운 데이터에 맞게 세밀하게 조정하여 성능을 향상시키고 학습 시간을 줄이는 과정이다. 쉽게 설명하자면, 파인튜닝은 이미 배운 것을 기반으로 새로운 문제를 해결하는 과정입니다. 예를 들어, 자전거를 타는 법을 알고 있는 사람이 오토바이를 타려고 할 때, 자전거 타기에서 배운 기초적인 지식을 활용하면서 오토바이에 맞게 몇 가지 세부 사항을 조정하게 됩니다. 이처럼 파인튜닝은 이미 학습된 인공지능 모델을 새로운 문제에 맞게 미세하게 조정하여 성능을 높이고 학습 시간을 줄이는 과정입니다. 인공지능 분야에서는 다음과 같은 이유로 파인튜닝이 필요합니다. 1. 특정 도메인이나 작업에 최적화: 사전 학습된 인공지능 모델은 대규모 데이터셋으로 학습되어 일반적인 작업에 적합하지만, .. 2023. 8. 15.
Chat GPT 원리 Chat GPT는 대량의 텍스트 데이터를 학습하여, 사용자의 입력에 반응해 그에 맞는 텍스트를 생성한다. Chat GPT의 기본은 언어모델이다. 여태까지 주어진 단어들을 기반으로 다음 단어를 예측하는 모델이다. 방대한 양의 데이터를 학습하고, 정말 큰 트랜스포머 모델을 사용한다. 한 단어 한 단어를 예측하면서 대화를 생성해 나간다.예를 들어 "오늘 점심 메뉴는"으로 시작하는 문장 수십 수백만 개를 구해 GPT에게 주면, "돈까스" "맛있는" 등과 같이 주어와 높은 확률로 맥락이 매칭되는 다음 단어들을 찾아내는 방식이다. 1단계. 데이터 수집 대량의 텍스트 데이터를 수집하는 것이 첫 단계이다. 이 데이터는 인터넷의 웹 페이지, 책, 기사 등 다양한 곳에서 가져온다. 이 데이터는 구조화되지 않은 형태로 수집.. 2023. 7. 29.
ChatGPT란? ChatGPT는 사용자의 질문에 대화식으로 대답할 수 있는 챗봇이다. ChatGPT란? ChatGPT는 챗봇입니다. 2022년 12월 1일에 공개된 사용자의 질문에 대화식으로 대답할 수 있는 서비스이다. OpenAI에서 개발된 GPT-3.5 아키텍처를 기반으로 학습되었으며, 다양한 텍스트 데이터를 이용하여 훈련되었다. ChatGPT의 목적은 사용자들과 자연어로 대화하며 질문에 대답하고, 정보를 제공하고, 문제를 해결하는 것이다. ChatGPT의 학습 데이터에는 인터넷에서 수집한 방대한 양의 텍스트가 포함되어 있으며, 뉴스 기사, 백과사전, 문학작품, 논문, 대화 스크립트 등 다양한 소스가 포함되어 있다. 이를 통해 ChatGPT는 폭넓은 주제에 대해 이해하고 일반적인 질문에 답변할 수 있도록 훈련되어 있.. 2023. 6. 23.
피부암을 진단하는 Model Dermatology 앱 사용후기 병원에 갈 수 없는 시간대에 마음을 안정시키기 위한 자료로 사용하기에 좋았던 것 같다. 어느 날 엄마의 턱에 갑자기 검은색 점이 생겨났고 나는 이것저것 관련된 키워드들로 검색해 보며, 이것이 무엇인지 알아보려 했다. 잠깐만 찾아봐도 안 좋은 이야기들이 많아 불안하여 빨리 병원에서 진단을 받아보고 싶었지만, 병원에 갈 수 없는 밤 시간대여서 마음만 불안한 채로 계속 이것저것 찾아보았다. 그러다가 사진을 찍으면 피부암인지 AI로 진단을 해주는 스마트폰 앱 사용후기 기사를 보게 되었고, 기사에서 가장 결과가 정확했다는 앱인 Model Dermatology를 빠르게 다운받아서 사용해 봤다. [해봤습니다] AI로 진단하는 피부암? 스마트폰 앱 3종 비교 [편집자주] 매일 쏟아져 나오는 새로운 IT 서비스‧디바이스.. 2023. 1. 8.
이미지의 분위기에 맞는 음악을 생성할 수 있는 AI Hugging Face에서 Img To Music 모델을 사용해보자! 이미지의 분위기에 맞게 음악을 생성해주는 AI 모델을 Hugging Face에서 쉽게 체험해볼 수 있어서 나도 한번 사용해보았다. 먼저, Hugging Face는 어떤 사이트인가? Hugging Face Hugging Face는 기계 학습을 사용하여 애플리케이션을 구축하기 위한 도구를 개발하는 미국 회사입니다. 자연어 처리 애플리케이션용으로 구축된 Transformers 라이브러리와 사용자가 기계 학습 모델 및 데이터 세트를 공유할 수 있는 플랫폼으로 가장 유명합니다. Hugging Face 설명을 보다보니 Transformers가 무엇인지 궁금해져 찾아보았다. Transformers 트랜스포머 모델은 문장 속 단어와 같은 순차 데이터.. 2023. 1. 8.
GPU가 AI 연구에 왜 중요할까? AI 시대가 빠르게 다가올 수 있었던 것은 GPU(Graphic Process Unit) 덕분이다. GPU란? Graphic Process Unit, 그래픽 처리 장치 컴퓨터 그래픽 가속을 담당하는 칩 PC 역사에 1980년대에 첫 등장 주요 기능은 여전히 최신 인기 게임의 그래픽과 점점 생생 해지는 비주얼이긴 하지만, 최근에는 범용적인 병렬 프로세서로도 발전하여 점점 더 다양한 응용 프로그램을 처리하고 있다. GPU가 AI 연구에 왜 중요할까? 복잡한 AI 소프트웨어를 구현하기 위해서는 높은 성능의 하드웨어가 필수적이다. 자연어 처리나 머신 비전과 같은 AI 모델에서는 프로세서 병렬 연산 속도가 얼마나 빠르냐를 기준으로 성능을 구분한다. 그렇기 때문에 컴퓨터 그래픽을 빠른 속도로 처리하기 위해 만들어진.. 2022. 12. 4.
눈으로 보는 통화, SKT의 AI 통화녹음 STT(Speech To Text) 기술로 음성 전화 통화를 문자로 변환해주는 서비스가 출시되었다. STT 기술의 활용 방식이 점점 더 다양해지고 있다. 기존에 자주 사용해왔던 STT 기술은 음성 키패드나 클로바 노트 정도였고, 이러한 서비스들도 일상 속의 당연한 불편함을 해결해준 사례라고 생각하는데, 이번 AI 통화 녹음 서비스도 사용자들이 당연하게 겪어왔던 불편함을 시원하게 긁어준 좋은 케이스라고 생각한다. 업무용으로 사용될 경우가 많을 것 같은데 업무 플랫폼과 연동이 되어도 유용할 것 같다는 생각을 해보게 되었다. 서비스의 슬로건은 "SK 텔레콤의 AI통화녹음 서비스가 당신의 일하는 능력을 높여줍니다."이다. 음성을 문자로 변환하는 기술인 STT 기술을 사용하였으며, 인터페이스를 대화창 형태로 구성.. 2021. 11. 24.
스케치의 색을 자동으로 채워주는 네이버 웹툰 AI 페인터 앞으로는 그림을 잘 그리지 못해도 웹툰 작가가 될 수 있을 것 같다. 많은 사람들이 좋은 스토리와 아이디어가 있음에도 불구하고, 그림을 잘 그리지 못해서 또는 그림을 한컷 한컷 그리는 것이 힘들 것 같아서 웹툰 작가가 되지 못한다. 하지만, 앞으로는 이런 사람들에게도 기회가 찾아오게 되었다. 네이버에서 출시한 AI 기반 자동 채색 서비스 때문이다. 웹툰 AI 페인터는 딥러닝 기술을 활용하여 스마트 툴로 웹툰을 만드는 인물과 배경 등을 자동으로 채색시켜주는 기술 등을 탑재한 것이 특징이다. 스케치 그림에서 원하는 색을 선택하면 AI가 어울리는 색상을 찾아 자동으로 채색을 해주는 서비스로, 이 서비스는 네이버가 제공하는 웹툰 데이터를 기반으로 제작된 것으로 분석된다. 네이버는 다양한 장르와 많은 양의 웹툰 .. 2021. 11. 10.
자연어 처리(Natural Language Processing)란? 인공지능의 한 분야로, 컴퓨터가 인간의 언어를 이해할 수 있도록 처리하는 연구 방법 자연어는 우리가 일산 생활에서 사용하는 언어이며, 자연어 처리는 이러한 자연어의 의미를 분석하여 컴퓨터가 처리할 수 있도록 하는 일을 말한다. 자연어 처리는 기계에게 인간의 언어를 이해시킨다는 점에서 인공지능에 가장 중요한 연구 분야이면서도, 아직 정복되어야 할 산이 많은 분야이다. 자연어 처리의 응용 분야 1) 정보 검색, 질의응답 시스템 - 구글/네이버/다음 검색 포털에서 무언가를 검색한 후, 결과들 중 하나를 클릭하면 시스템은 이를 자신이 찾은 결과가 적합했다는 신호로 인식하고 향후 검색에 이 정보를 이용해 검색 정확도를 높인다. 2) 대화 시스템 및 자동 질의 응답 시스템 - 슬랙, 마이크로소프트 메신저, AI 스.. 2021. 6. 27.
음성 인식 AI의 장단점 음성은 사람에게 가장 익숙한 커뮤니케이션 수단이다. 하지만, 사용자들이 음성 기능을 매일 같이 유용하게 사용하기 위해서는 해결해야 하는 이슈들이 있다. 음성 인식 AI의 장점 1) 음성 이라는 가장 자연스러운 형태의 UX이기에 직관적이며 학습 비용이 낮다. 2) 자판 입력에 비해 속도가 2~6배 빠르며, 기기 조작이 익숙하지 않은 노인 및 유아의 사용을 쉽게 도와준다. 3) 음성이 신원 인증과 결제 보안 인증까지 담당할 수 있기 때문에, 커머스 서비스에 적용될 경우 편의성이 높아진다. 4) 손 조작 없이 다른 일을 하면서도 음성 조작으로 멀티 테스크가 가능하다. 그렇기 때문에 터치가 익숙한 스마트폰보다는 가정에서 사용하는 스마트 스피커나 스마트 TV, 운전 중 터치 스크린을 조작하기 힘든 자동차에 음성 .. 2021. 6. 27.
반응형